X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> проблема с кодировкой Unicode utf-7
eiskalt
eiskalt
Topic Starter сообщение 17.5.2013, 11:30; Ответить: eiskalt
Сообщение #1


Всем доброго времени суток,

Может может кто-нибудь подсказать выход из следующей проблемы: На одной из страниц моего сайта я изменил кодировку с кириллицы на Unicode utf-7 при помощи проги Namo Web Editor 9. После этого на странице отображаются одни иероглифы, пробовал изменить обратно, не получается. Кодировку изменил по совету ребят с narod.ru. Возможно ли как-то вернуть первоначальный вариант страницы, или всё потеряно безвозвратно?! Адрес сайта: romanjulia@narod.ru. После переезда с narod. в некоторых разделах сайта перестала отображаться кириллица.

Заранее спасибо за помощь.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
danilhtml
danilhtml
сообщение 29.5.2013, 22:11; Ответить: danilhtml
Сообщение #2


notepad++ вам поможет!

Если не справитесь, пишите мне!
тут контакты: danil-html.ru


--------------------
клоновод
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Arks
Arks
сообщение 29.5.2013, 23:53; Ответить: Arks
Сообщение #3


Скорее всего notepad++ тут не поможет.
Кодировка - это способ представления бинарной информации.
Стандарт UTF-7 был придуман специально для замены UTF-8 в email, чтобы вместо использования quoted-printable использовать ASCII-символы.
Таким образом на выходе файла сохраненного в UTF-7 набор ASCII-символов, которой любой программой декодирования будет распознаваться как... набор ASCII символов!
Если попытаться перекодировать ASCII символы в многобайтную кодировку - то они так и останутся однобайтными.
Таким образом обратное кодирование из UTF-7 в UTF-8 невозможно, т.к. декодер не может знать какие из однобайтных символов входят в многобайтный кортеж.
Если же теоретически предположить что стандарт полностью обратно совместим с BASE64 то декодирование становится возможным, т.к. все кортежи имеют длину ровно 2 байта. Но мне это кажется несколько бредом, ибо тогда получается что ряд языков становится недоступен(физически 7 бит меньше 8) или имеет место быть очень большой оверхед(14 vs 8).

Собственно обратное декодирование возможно только в одном случае - когда количество байт/символ в новой кодировке увеличивается. Здесь же мы видим что используется 7 бит-единица и символ состояит из 2 байт - т.е. двух таких единиц + пары битов на хз-что.
Надеюсь что я не прав.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Vapaamies
Vapaamies
сообщение 1.6.2013, 11:06; Ответить: Vapaamies
Сообщение #4


(Arks @ 30.5.2013, 02:53) *
Скорее всего notepad++ тут не поможет.

Скорее всего, Notepad++ тут не поможет, но лишь потому, что все уже необратимо испорчено, а совершенно не по той причине, которую описал уважаемый Arks.

Про необратимость -- мое предположение, учитывающее уровень подготовки автора темы, видимый по его сообщению.

(Arks @ 30.5.2013, 02:53) *
Таким образом обратное кодирование из UTF-7 в UTF-8 невозможно

Совершеннейшая неправда. Все транспортные форматы Unicode (UTF) взаимно обратимы между собой, поскольку Unicode кодирует абстрактные символы, называемые "кодовыми точками".

Семибитный транспортный формат (UTF-7) действительно был придуман для использования в e-mail в тех случаях, когда разрешены только 7-битные символы. Технически он реализован как своего рода inline base64 -- расширенные символы кодируются в одну из разновидностей base64 и записываются в виде многобайтовых (многосимвольных) последовательностей, начинающихся символом "+", если мне не изменяет память, и заканчивающихся еще чем-то. Символы с большими кодами в таком представлении могут растягиваться в 9-байтовые последовательности -- опять же, если мне не изменяет память.

Понятное дело, что такая избыточность -- не просто так, а допускает обратное декодирование при условии, что сами последовательности не повреждены.

Если у автора темы действительно UTF-7, а не UTF-8, то угораздило же его так вляпаться, с чем его и поздравляю. Сейчас даже самим концерном Unicode кодировка UTF-7 признается устаревшей в связи с отмиранием серверов, поддерживающих только 7-битные кодировки.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Проблема с админкой
5 Prok 2337 29.7.2019, 20:04
автор: dvakarandasha
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыПроблема с таблицей, которая выводится через скрипт
7 vanchester 1339 15.2.2019, 19:06
автор: Artos_mw
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыПроблема в тегах при сохранении контента
1 Kord18 1429 13.3.2018, 18:19
автор: Evgeniy3200
Открытая тема (нет новых ответов) Тема имеет прикрепленные файлыПроблема вёрстки адаптивной страницы на divах
28 master-vek 4718 8.2.2018, 19:29
автор: master-vek
Открытая тема (нет новых ответов) Проблема с All in one SEO?
17 okseo 2686 30.11.2017, 14:06
автор: okseo


 



RSS Текстовая версия Сейчас: 24.4.2024, 15:43
Дизайн