Автор | Сообщение |
|
Отправлено: 07.04.05 00:54. Заголовок: Ошибки в текстах
Исходим из того, что Милитера суть библиотека. Отсюда, казалось бы, следует, что идеал состоит в точном соответствии электронных текстов их бумажным оригиналам. В этом смысле ошибки OCR подлежат безусловному искоренению - это без вопросов. Если хозяин и повелитель сайта так заботится о возможности использовать тексты для цитирования, что требует возиться с номерами страниц - хотя это сильно прибавляет трудоемкости, - то менять текст нельзя. А если не менять нельзя? В наш халтурный (заработать, а не дело сделать) век книги изобилуют грамматическими и орфографическими ошибками, опечатками, очепатками и даже отчепятками. Безграмотности в интернете и так хватает. По моему глубокому убеждению, бороться с незнанием родного языка можно единственным способом: на глаза читателю должны попадаться только правильные, как диктант на пятерку, тексты. И вот вопрос - что делать? Мне кажется, это вопрос политики, и, пообсуждав его, если нужно, на Форуме, нужно придти к некоторому решению - здесь последнее слово, безусловно, за Хоаксером - сделать его правилом, обязательным для правщиков. Только это правило не должно содержать никаких оценок и сравнительных степеней, вроде «грубые ошибки и явные опечатки править, а негрубые и неявные - оставлять». По поводу ошибок второго рода (по классификации сегодняшнего поста Хоаксера) - осмелюсь предложить такой прием: в файл с соответствующим текстом помещать на правах отдельной главки разного рода дополнения, уточнения и замечания, возникщие у обработчика текста, а может быть, и позже, у читателей, после размещения текста на сайте. Мне кажется, это будет корректно по отношению к автору, на, боюсь, прибавит работы содержателям сайта. Отмечу только, что деление на фактические ошибки и опечатки достаточно условно. Так, в примере, приведенном Хоаксером: в книге «Инженерные войска в боях за Советскую Родину» фраза «7-я понтонно-мостовая бригада и 1-й понтонно-мостовой полк — присвоением наименования Люблинских...» не соответствует действительности, т.к. наименование им было присвоено Лодзинских, а не Люблинских, чему есть документальное подтверждение. - речь идет на самом деле, скорее всего, об ошибке какой-нибудь машинистки или наборщицы, для которых слово Люблинский - привычно, а слово Лодзинский - нужно еще разглядеть. Кстати, ту же ошибку мог сделать и сам автор, пробегая глазами источники, вместо того чтобы читать Плюс экономия на корректорах (купили спеллер, что вам еще нужно?).
|
|
Цитата
Ответить
|
Ответов - 37
[только новые]
|
|
|
Отправлено: 07.04.05 03:10. Заголовок: Re: Ошибки в текстах
Зачем же отдельный файл? Ставите ссылку на комментарий и даете правильную версию. Или, если в двух словах можно - сразу в скобках.
|
|
Цитата
Ответить
|
|
Отправлено: 07.04.05 09:54. Заголовок: Re: Ошибки в текстах
1. Я не считаю наш век халтурным, и вообще как-то отличающимся в принципе от других веков. Достаточно почитать Гесиода с Екклезиастом, чтобы понять -- всё одно и то же. Поэтому часто встречающиеся сетования на тему «в наше нелёгкое время» или «эхе-хе, времена такие» -- считаю типичным конформизмом сетующего, который заранее подстелил себе соломку на тот случай, если придётся упасть в грязь лицом -- дескать, не виноват я, это век-волкодав такой у нас, набросилси-и... Это было общее рассуждение, не относящееся ни к кому на этом форуме конкретно. 2. Пагинация страниц очень важна, поэтому ей уделяется такое внимание. Она гораздо важнее, чем исправление ошибок первого рода -- потому что цифровой «образ» печатной книги конкретного издания должен делиться на страницы так же, как и оригинал. А опечатки-ошибки в данном случае не влияют на дальнейшее использование текста -- при цитировании их можно исправить, а вот номера страниц восстановить не получится. У любой электронной библиотекой есть постоянный выбор -- выложить книгу с ошибками, доведя её до определённой приемлемой степени готовности, либо держать её до тех пор, пока они не будут все вычищены. Второе -- сугубый формализм, который требует таких же затрат, каких требует корректура при издании печатной книги, чего себе не могут позволить многие эл. библиотеки (всё-таки это, в основное, проекты энтузиастов). Когда я спрашивал читателей, что им больше по душе -- когда в месяц появляется 10 книг, вычищенных от и до, либо 30, с опечатками, все выбирали второе. Вот он, вокс попули, и не будем идти против шерсти. 3. Согласен, что если в тексте встречаются ошибки второго рода, т.е. фактические, исправлять их в тексте (заменять) не надо, а надо давать в виде комментария. Будем это делать так: надо придумать особый знак, например {=1} или ещё как, чтобы больше он ни к каким примечаниям не был привязан, выделять его особым цветом, и помещать в том же файле (app.html), что и обычные примечания. В данном случае от слова Люблинские , будет идти подобная ссылка на пояснение -- в чём ошибка, чем обоснована поправка и кто её сделал.
|
|
Цитата
Ответить
|
|
Отправлено: 26.05.05 18:16. Заголовок: Re:
Олег! Ну что ж такое - ошибки вижу только после опубликования на сайте. Наверно это сила печатного слова. Эрр Ф.-Ж. Артиллерия в прошлом, настоящем и будущем Аннотация издательства: В настоящем труде французский ген. Эрр на основе опыта империалистической войны 1914–1918 гг. подвергает критическому рассмотрению все основные вопросы, касающиеся как техники, так равно тактики и организации артиллерии. Очертив происшедшую за время указанной войны эволюцию взглядов на использование артиллерии и попутно отметив вызванные этой эволюцией изменения в области материальной части и организации, автор выясняет, какова должна быть для будущей войны наилучшая система материальной части, а также организация артиллерии, и что было сделано в этом отношении после войны в главнейших армиях мира. Меркац Ф. Германское войсковое руководство по пулеметному делу Аннотация издательства: Из предисловия: Каждому строевому т.е. дубель Боевой устав пехоты Красной Армии (1942). Часть 2 (батальон, полк) Правка моя, а ОКР не знаю чей - вы присылали когда-то файл
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 09:07. Заголовок: Re:
amyatishkin пишет: цитата Ну что ж такое - ошибки вижу только после опубликования на сайте. Наверно это сила печатного слова.
Между прочим, неоспоримый факт. Со мной то же самое.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 15:55. Заголовок: Re:
Это отражение монитора. А может - признак истинного арийца. :)
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 16:50. Заголовок: Re:
S.N.Morozoff пишет: цитата признак истинного арийца
Бр-р. Нехорошо звучит как-то... Тогда давайте придеремся к курчавым вьющимся волосам - а что, похожи на еврейские....
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 17:10. Заголовок: Опечатка
юдей = людей (букву пропустил)
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 17:24. Заголовок: Re:
tancist, "Иванов" Хороший аватар, правда?! :) Вот ведь покою не дает! "Иванов" Зачем, спрашивается, посты удалять? Теперь про отражение в мониторе - вообще в воздухе висит! Нехорошо-с! Сами же начали...
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 18:05. Заголовок: работа над ошибками
Голубые глаза аватара - это линзы?
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 18:05. Заголовок: работа над ошибками
при хорошем увеличении виден второй уровень тетриса. Или даже третий...
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 18:07. Заголовок: Re:
S.N.Morozoff пишет: цитата Вот ведь покою не дает!
так если зеленым крипичом по голове - какой тут покой!
|
|
Профиль
Цитата
Ответить
|
|
|
Отправлено: 27.05.05 18:09. Заголовок: Re:
"Иванов" пишет: цитата так если зеленым крипичом по голове - какой тут покой!
"Кирпичи - не кирпичи без пары-тройки бутылок!" :)
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 18:16. Заголовок: Re:
Красная звездочка! и больше я вам, буржуинам, ничего не скажу!
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 18:28. Заголовок: Re:
Это не звездочка - это знак качества на зеленом кирпиче. Что Вы хотите от WEB сжатия? Да и вообще - ребенок рисовал! Нет, определенно, аватар был выбран правильный. :)
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 18:36. Заголовок: Re:
:)
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 27.05.05 21:28. Заголовок: Re:
S.N.Morozoff пишет: цитата 6 "А" класс - ребенок рисовал
Да я уже в 8 лет модельки клеил, а тут...
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 28.05.05 14:01. Заголовок: Re:
tancist пишет: цитата Да я уже в 8 лет модельки клеил
И за сколько из тех, восьмилетних, Вам теперь не стыдно? То-то же (произносится отеческим тоном).
|
|
Цитата
Ответить
|
|
Отправлено: 28.05.05 14:55. Заголовок: Re:
Максим пишет: цитата И за сколько из тех, восьмилетних, Вам теперь не стыдно
Это уже другой вопрос.... :)
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 28.05.05 17:57. Заголовок: Re:
"Иванов" пишет: цитата так если зеленым крипичом по голове
и в другом месте: цитата Это не звездочка - это знак качества на зеленом кирпиче
Нужна ли лучше иллюстрация проблеме интерпретации? И отрицания очевидного факта (звездочка-то она звездочка, с пятью лучами, нечего за WEB прятаться).
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 02.06.05 11:59. Заголовок: опечатка Яндекса
если набрать в окне поиска имена людей Liz Driscall, Simon Greenall, Яндекс дает подсказку: translit? возможно, имелось в виду: «Лиц Дрыщалл, Симон Грееналл»
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 07.06.05 11:15. Заголовок: Re:
Попов А.Ю. "Диверсанты Сталина". в биографической справке по Рабцевичу А.М. указано что умер он в 1961 г., а вышел на пенсию в 1963. Разведчик, конечно, но не до такой же степени!
|
|
Профиль
Цитата
Ответить
|
|
|
Отправлено: 07.06.05 15:20. Заголовок: Re:
А это так в тексте было. Вот.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 08.06.05 06:57. Заголовок: Re:
Значит дядя точно шпион!
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 08.06.05 11:38. Заголовок: Re:
nikola_ufa пишет: цитата дядя точно шпион
Мож я не прав, но Шпиён - это ИХ, а у НАС - разведчик!
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 08.06.05 15:13. Заголовок: Re:
Это да, это так.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 18.07.05 15:58. Заголовок: Книга про воздушную разведку
В оглавлении осталась ошибка OCR "последнею наступления" вместо "послегнего"
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 18.08.05 12:40. Заголовок: Re:
Кстати, меня удивляет регулярный глюк распознавания (как мне кажется) - очень часто буква "о" в конце названий населенных пунктов превращается в "е": Сталине вместо Сталино, Волкове вместо Волково и т.п. Это касается не только Милитеры но и всего lib.ru. Интересно где глюк базируется?
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 18.08.05 15:42. Заголовок: Re:
2GvShAD_Romeo Программа воспринимает слово как соответствующую фамилию. Вылавливать это сложно.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 18.08.05 15:54. Заголовок: Re:
То есть виновата не распознавалка, а проверялка? А если попробовать ее отключить?
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 18.08.05 16:16. Заголовок: Re:
Там сложнее становиться проверять. Т.е. если стоит "показывать максимум ошибок", то такое название (если в базе есть похожая фамилия) первый раз на странице подсвечивается на ошибке. А остальные разы может без подсветки идти. А если уменьшать уровень выявления ошибок - их будет в разы меньше показываться. Т.е. проверка сведется к фикции.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 18.08.05 17:28. Заголовок: Re:
Кстати, то же самое имеет место при распознании иностранных фамилий, похожих на имена - Робертс похоже на Роберт и распознается как Роберте.
|
|
Профиль
Цитата
Ответить
|
|
|
Отправлено: 18.08.05 20:12. Заголовок: Re:
Вот интересно. На 5-м ридере и на газетном тексте Сталино - Сталине и тому подобные ошибки - далеко не норма. Как правило распознается верно. Характерные ошибки другие - "п" и "н", например, уже упомянутые "ею" и "его". То есть чистые ошибки распознавания букв из-за некачественной печати.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 26.08.05 09:38. Заголовок: Re:
6 FReader: текст дрянной, но стабильно распознается "прочность" как "дрочность".
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 30.09.05 10:54. Заголовок: Re:
Частенько еще "с" в конце слова читается как "е", особенно в буржуазных словах. Массово "Таймс" становится "Тайме". В книге Дэвидсона о Вьетнамской войне генерал Абрамс становится порой "Абраме" (таки-да? ), а Дин Раск - "Раек".
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 30.09.05 10:56. Заголовок: Re:
Vitaliy пишет: цитата Массово "Таймс" становится "Тайме".
С "Таймсом" - точно. А аббревиатуру ВКП(б) Ридер еще ни разу на моей памяти не распознал правильно, во всяком случае в газетном тексте.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 01.10.05 10:31. Заголовок: Re:
Это проблема большинства английских фамилий, которые состоят из имени+"с" на конце. (Фактически ситуация та же, что и у пар Иванов-Иваново). Но, теоретически, должна полегче решаться. Я вот никак собраться токо не могу: Сканится из словаря англо-русского для школьников раздел с именами, распознается, добавляем "с" и вводим в Файнридерский словарь.
|
|
Профиль
Цитата
Ответить
|
|
Отправлено: 02.10.05 18:46. Заголовок: Re:
В предисловии к "Ледоколу": Страшно было умереть, не написал этой книги Нужно "не написав".
|
|
Профиль
Цитата
Ответить
|
|