Как узнать кодировку текста?
Текст в файле, электронном письме, на веб-странице может быть набран на любом языке и сохранен в различной компьютерной кодировке. Дело состоит не только в многообразии современных кодировок, которые более-менее упорядочены, но и хранении документов, представляющих в первую очередь историческую ценность. Также встречаются случаи, когда документ несколько раз был сохранен в различных кодировках. Если текст открывается в виде непонятного набора символов, его необходимо привести в вид, доступный для чтения. Если текст не читается на веб-странице, сделайте подбор кодировки в браузере. Для этого кликните левой клавишей мышки в меню «Вид» по пункту «Кодировка». В выпадающем списке переберите доступные кодировки, пока текст не примет читаемый вид. Первая русская кодировка KOI-8 появилась на компьютерах, когда еще они не были персональными, с операционной системой UNIX. Применяется на компьютерах с UNIX-подобными операционными системами – например Linux. Следующей была русская кодировка DOS-866 для операционной системы MS-DOS от компании Microsoft. С выпуском Windows 3.0 в дело вступила Win-1251. Сейчас на UNIX-подобных системах применяется кодировка ISO 8859-5. Кроме них иногда можно встретить альтернативную кодировку 855, DKOI-8, ГОСТ и болгарскую кодировку. Очень редко можно встретить на документах кодировку MacCyrillic, применяемую только на компьютерах «Макинтош». Сохраните текст в текстовом файле, затем откройте его в текстовом редакторе, при необходимости попробуйте открыть документ в нескольких различных текстовых редакторах. Файловые менеджеры также могут определить кодировку, в которой сохранен файл, и преобразовать его в необходимую кодировку. Поместите часть текста или весь текст, в зависимости от его размера, в онлайновый декодер (дешифратор, декодер почты, конвектор кириллицы). После декодировки будет предложено несколько вариантов текста, а также название кодировки, в которой предположительно находится файл. Для определения кодировки и при необходимости перекодировки текста необходимо использовать специальные программы «перекодировщики». Данные программы достаточно популярны в интернете и просты в использовании, при этом некоторые из них позволяют работать с максимально возможным количеством применяемых кодировок и предоставляют максимально доступные возможности по работе с ними. Совет добавлен 27 июля 2011 Совет 2: Как определить кодировку Иногда требуемый файл или веб-страница не открывается, а при ее отображении видны только непонятные символы. Бывают случаи, когда текстовый редактор или браузер не может определить необходимую кодировку. В таком случае ее приходится подбирать самому при помощи дополнительных утилит. Если файл некорректно открылся в одном редакторе, это вовсе не означает, что он имеет неправильную кодировку. Стоит попробовать открыть тот же файл в другой программе. Одной из утилит, которые в большинстве случаев точно определяют необходимый набор символов, является бесплатный редактор Notepad++. Если открыть файл все-таки не удается, то можно воспользоваться онлайн сервисами для определения кодировки, которых в интернете есть великое множество. Также существуют программы, которые способны расшифровывать русские тексты в разных кодировках. Несомненно, лидером является приложение «Штирлиц» для Windows. Оно знает практически все кодовые листы и знает множество методов транслитерации. Более того эта программа способна производить операции трансформации текста из исходного формата в любой другой. В Linux, чтобы открыть какой-либо файл, содержащий незнакомую кодировку, можно воспользоваться некоторыми консольными командами преобразования или готовыми программами. Под QT существует приложение QTexTransformer, которое поможет определить название кодировки и произвести соответствующие преобразования.Под Linux существует множество лингвистических модулей, написанных на языке Perl. Например, Lingua DetectCharset или DetectCyrillic (для определения кириллических символов). Хорошо отображает файлы Windows программа mousepad. Для конвертирования также можно воспользоваться консольной командой «econv путь_до_файла», которая самостоятельно определит текущую кодировку и преобразует ее к текущей локали. Полезный совет Хорошо с выбором нужной кодировки справляется текстовый процессор Word. Даже если файл не открылся в других редакторах, в нем сработает функция «Автовыбор». Источники
Вам понадобится
- Компьютер, текстовый редактор, онлайновый декодер, специальные программы «перекодировщики»
Инструкция
Вам понадобится
- Текстовый редактор, работающий с большим числом кодировок, или программа-декодер.
Инструкция
- Один из самых известных декодеров текста