проблема с кодировкой Unicode utf-7

Сообщение сайта

(Сообщение закроется через 3 секунды)

Здравствуйте, гость (

| Вход | Регистрация )

SEO форум MaulTalk.com > Поисковая оптимизация > Поисковая оптимизация (SEO)

проблема с кодировкой Unicode utf-7

Опции

eiskalt

Topic Starter сообщение

17.5.2013, 11:30; Ответить: eiskalt

Сообщение #1

Группа: User
Сообщений: 1
Регистрация: 17.5.2013
Поблагодарили: 0 раз
Репутация:

Всем доброго времени суток,

Может может кто-нибудь подсказать выход из следующей проблемы: На одной из страниц моего сайта я изменил кодировку с кириллицы на Unicode utf-7 при помощи проги Namo Web Editor 9. После этого на странице отображаются одни иероглифы, пробовал изменить обратно, не получается. Кодировку изменил по совету ребят с narod.ru. Возможно ли как-то вернуть первоначальный вариант страницы, или всё потеряно безвозвратно?! Адрес сайта: romanjulia@narod.ru. После переезда с narod. в некоторых разделах сайта перестала отображаться кириллица.

Заранее спасибо за помощь.

Ответить с цитированием данного сообщения

danilhtml danilhtml 29.5.2013, 22:11; Сообщений: 54 Поблагодарили: 2 раза Репутация: -1 Просмотр профиля	29.5.2013, 22:11; Ответить: danilhtml Сообщение #2
клоновод Группа: Banned Сообщений: 54 Регистрация: 17.10.2012 Из: Украина Поблагодарили: 2 раза Репутация: -1	notepad++ вам поможет! Если не справитесь, пишите мне! тут контакты: danil-html.ru -------------------- клоновод

Arks Arks 29.5.2013, 23:53; Сообщений: 2780 Поблагодарили: 0 раз Репутация: 0 Просмотр профиля	29.5.2013, 23:53; Ответить: Arks Сообщение #3
0 Группа: User Сообщений: 2780 Регистрация: 20.3.2010 Поблагодарили: 0 раз Репутация: 0	Скорее всего notepad++ тут не поможет. Кодировка - это способ представления бинарной информации. Стандарт UTF-7 был придуман специально для замены UTF-8 в email, чтобы вместо использования quoted-printable использовать ASCII-символы. Таким образом на выходе файла сохраненного в UTF-7 набор ASCII-символов, которой любой программой декодирования будет распознаваться как... набор ASCII символов! Если попытаться перекодировать ASCII символы в многобайтную кодировку - то они так и останутся однобайтными. Таким образом обратное кодирование из UTF-7 в UTF-8 невозможно, т.к. декодер не может знать какие из однобайтных символов входят в многобайтный кортеж. Если же теоретически предположить что стандарт полностью обратно совместим с BASE64 то декодирование становится возможным, т.к. все кортежи имеют длину ровно 2 байта. Но мне это кажется несколько бредом, ибо тогда получается что ряд языков становится недоступен(физически 7 бит меньше 8) или имеет место быть очень большой оверхед(14 vs 8). Собственно обратное декодирование возможно только в одном случае - когда количество байт/символ в новой кодировке увеличивается. Здесь же мы видим что используется 7 бит-единица и символ состояит из 2 байт - т.е. двух таких единиц + пары битов на хз-что. Надеюсь что я не прав.

Vapaamies

1.6.2013, 11:06; Ответить: Vapaamies

Сообщение #4

Группа: User
Сообщений: 160
Регистрация: 13.7.2011
Поблагодарили: 0 раз
Репутация:

(Arks @ 30.5.2013, 02:53)

Скорее всего notepad++ тут не поможет.

Скорее всего, Notepad++ тут не поможет, но лишь потому, что все уже необратимо испорчено, а совершенно не по той причине, которую описал уважаемый Arks.

Про необратимость -- мое предположение, учитывающее уровень подготовки автора темы, видимый по его сообщению.

(Arks @ 30.5.2013, 02:53)

Таким образом обратное кодирование из UTF-7 в UTF-8 невозможно

Совершеннейшая неправда. Все транспортные форматы Unicode (UTF) взаимно обратимы между собой, поскольку Unicode кодирует абстрактные символы, называемые "кодовыми точками".

Семибитный транспортный формат (UTF-7) действительно был придуман для использования в e-mail в тех случаях, когда разрешены только 7-битные символы. Технически он реализован как своего рода inline base64 -- расширенные символы кодируются в одну из разновидностей base64 и записываются в виде многобайтовых (многосимвольных) последовательностей, начинающихся символом "+", если мне не изменяет память, и заканчивающихся еще чем-то. Символы с большими кодами в таком представлении могут растягиваться в 9-байтовые последовательности -- опять же, если мне не изменяет память.

Понятное дело, что такая избыточность -- не просто так, а допускает обратное декодирование при условии, что сами последовательности не повреждены.

Если у автора темы действительно UTF-7, а не UTF-8, то угораздило же его так вляпаться, с чем его и поздравляю. Сейчас даже самим концерном Unicode кодировка UTF-7 признается устаревшей в связи с отмиранием серверов, поддерживающих только 7-битные кодировки.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой

или обратитесь к любому из модераторов.

« Предыдущая тема · Поисковая оптимизация (SEO) · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Похожие темы

Тема	Ответов	Автор	Просмотров	Последний ответ
Проблема с админкой	5	Prok	2337	29.7.2019, 20:04 автор: dvakarandasha
Проблема с таблицей, которая выводится через скрипт	7	vanchester	1339	15.2.2019, 19:06 автор: Artos_mw
Проблема в тегах при сохранении контента	1	Kord18	1429	13.3.2018, 18:19 автор: Evgeniy3200
Проблема вёрстки адаптивной страницы на divах	28	master-vek	4718	8.2.2018, 19:29 автор: master-vek
Проблема с All in one SEO?	17	okseo	2686	30.11.2017, 14:06 автор: okseo

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 24.4.2024, 15:43

Дизайн