Emacs для начинающих

       

Faq


  

rusconv v.3.11.

Полезные советы и ответы на типичные вопросы.

Содержание:

Как сделать, чтобы операционная система сама находила и запускала программы rusconv и whatrus?

  • Какие файлы можно конвертировать с помощью rusconv?

  • Для чтения почты используется Netscape. Пришло письмо в неправильной кодировке. Что делать?

  • С помощью Netscape Composer (или Frontpage, или еще какого-либо HTML-редактора) была создана HTML-страничка в кодировке windows. Rusconv преобразовал ее в кодировку КОИ-8. Почему вместо русского текста обозреватель выводит мусор?

  • На концах строк находятся странные символы. Как их убрать?

  • Можно ли использовать исходные тексты rusconv в своих программах?

  • Как лучше всего сделать ссылку на rusconv со своей HTML-странички?



  • Как сделать, чтобы операционная система сама находила и запускала программы rusconv и whatrus?

     В DOS и windows создайте какой-нибудь каталог, в котором будут находиться rusconv и whatrus, например, C:\UTIL. Скопируйте в него rusconv и whatrus. Отредактируйте файл C:\AUTOEXEC.BAT: в нем в переменную PATH добавьте директорию C:\UTIL. Для этого проще всего на последней строке файла написать команду

    PATH=%PATH%;C:\UTIL

     После перезагрузки, rusconv и whatrus можно будет запустить из любой директории.

     В UNIX, если Вы являетесь системным администратором, rusconv и whatrus лучше всего скопировать в директорию /usr/local/bin. Тогда эти утилиты будут доступны всем пользователям. Если же у Вас нет прав на это, то можно создать в своем домашнем каталоге директорию bin и скопировать программы туда. Обычно переменная PATH настроена правильно и содержит эту директорию. В противном случае, надо отредактировать файл начальных установок (скорее всего, ~/.bashrc) и повторно войти в систему.

    Какие файлы можно конвертировать с помощью rusconv?

     С помощью rusconv можно конвертировать любые файлы, содержащие текст. Среди них - '.txt', '.html', '.tex', '.rtf',

    исходные тексты программ и другие. Документы (.doc-файлы), создаваемые с помощью Microsoft Word, не являются текстовыми, и при использовании rusconv могут быть испорчены.






    Для чтения почты используется Netscape. Пришло письмо в неправильной кодировке. Что делать?


     Вначале надо просто поменять кодировку, используемую для просмотра почты. Если это не помогает, создаем новую папку с письмами (File->New Folder...). Называем ее, например, recover и копируем в нее письмо. Смысл всего этого в том, что создается файл с именем типа C:\Program files\Netscape\Users\<Ваше имя>\mail\recover. Он содержит сообщение в том виде, в котором его получил Netscape и, что самое главное, этот файл - текстовый. Теперь можно определить его кодировку, и с помощью rusconv привести его к читаемому виду.

     Лучше всего перевести текст в ту кодировку, в которой он был отправлен. Тогда Netscape будет выводить письмо правильно. Чтобы определить исходную кодировку, нужно открыть файл 'recover' и найти в нем строчку типа Content-type: text/plain; charset=koi8-r.





    С помощью Netscape Composer (или Frontpage, или еще какого-либо HTML-редактора) была создана HTML-страничка в кодировке windows. Rusconv преобразовал ее в кодировку КОИ-8. Почему вместо русского текста обозреватель выводит мусор?


     С помощью специальных тегов можно сказать обозревателю, какой набор символов использовать для вывода HTML-страницы. Причем отказаться от него невозможно - что бы Вы ни выбрали в меню View->Encoding, будет использоваться все равно он.

     Большинство HTML-редакторов автоматически добавляют команду задания кодировки. Если сконвертировать файл вне этого редактора, то страничка окажется в другой кодировке, а команда останется без изменения. Из-за этого в данном примере обозреватель использует кодировку windows для отображения странички в КОИ-8. Неудивительно, что вместо текста выводится мусор.

     Один из вариантов решения проблемы - переводить HTML-файл в самом редакторе (если он это позволяет). Другой путь - использовать rusconv для конвертирования, а затем в новой версии файла найти строку

    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">



     и заменить поле charset на правильное (например, koi8-r). Но лучше всего - удалить эту строку.





    На концах строк находятся странные символы. Как их убрать?


     Первый вариант. Вы работаете в операционный системе UNIX. Возможно, в тексте используется DOS/windows-формат кодирования концов строк. Чтобы преобразовать файл в UNIX-формат, используйте флаг 'crlf2cr'.

     Второй вариант. Вы работаете в DOS или windows. Возможно, вы случайно изменили тип концов строк из UNIX-формата в DOS-формат, причем строки уже были в DOS-формате. Для исправления файла запустите rusconv дважды - вначале с флагом '-crlf2cr', а затем с флагом '-cr2crlf'.

     Третий вариант. Тип концов строк ни при чем. В этом случае удалить лишние символы можно вручную.





    Можно ли использовать исходные тексты rusconv в своих программах?


     Вносить изменения в исходные тексты и создавать свои версии программ rusconv и whatrus - нельзя. Но использовать части кода в своих проектах - можно. При этом желательно указать в документации, что использованы исходные тексты rusconv или whatrus, а также дать адрес web-узла rusconv (http://beta.math.spbu.ru/~prof/w_re/).





    Как лучше всего сделать ссылку на rusconv со своей HTML-странички?


     Как Вам больше нравится. Адрес web-узла rusconv:

    http://beta.math.spbu.ru/~prof/w_re/

     По умолчанию загрузится windows-версия. Начальные странички в других кодировках имеют адреса:

    http://beta.math.spbu.ru/~prof/w_re/index.html - windows http://beta.math.spbu.ru/~prof/w_re/index-k.html - КОИ-8 http://beta.math.spbu.ru/~prof/w_re/index-l.html - latinica http://beta.math.spbu.ru/~prof/w_re/index-e.html - english



    Приятной работы!


    faq.html

    Документ создан Паращенко Олегом

    Последние изменения - 15 ноября 1998 года


    Содержание раздела