Форум сайта
Новичкам о регистрации на форуме.
АвторСообщение



Не зарегистрирован
ссылка на сообщение  Отправлено: 07.04.05 00:54. Заголовок: Ошибки в текстах


Исходим из того, что Милитера суть библиотека.

Отсюда, казалось бы, следует, что идеал состоит в точном соответствии электронных текстов их бумажным оригиналам. В этом смысле ошибки OCR подлежат безусловному искоренению - это без вопросов.

Если хозяин и повелитель сайта так заботится о возможности использовать тексты для цитирования, что требует возиться с номерами страниц - хотя это сильно прибавляет трудоемкости, - то менять текст нельзя. А если не менять нельзя? В наш халтурный (заработать, а не дело сделать) век книги изобилуют грамматическими и орфографическими ошибками, опечатками, очепатками и даже отчепятками. Безграмотности в интернете и так хватает. По моему глубокому убеждению, бороться с незнанием родного языка можно единственным способом: на глаза читателю должны попадаться только правильные, как диктант на пятерку, тексты. И вот вопрос - что делать? Мне кажется, это вопрос политики, и, пообсуждав его, если нужно, на Форуме, нужно придти к некоторому решению - здесь последнее слово, безусловно, за Хоаксером - сделать его правилом, обязательным для правщиков. Только это правило не должно содержать никаких оценок и сравнительных степеней, вроде «грубые ошибки и явные опечатки править, а негрубые и неявные - оставлять».

По поводу ошибок второго рода (по классификации сегодняшнего поста Хоаксера) - осмелюсь предложить такой прием: в файл с соответствующим текстом помещать на правах отдельной главки разного рода дополнения, уточнения и замечания, возникщие у обработчика текста, а может быть, и позже, у читателей, после размещения текста на сайте. Мне кажется, это будет корректно по отношению к автору, на, боюсь, прибавит работы содержателям сайта.

Отмечу только, что деление на фактические ошибки и опечатки достаточно условно. Так, в примере, приведенном Хоаксером:

в книге «Инженерные войска в боях за Советскую Родину» фраза «7-я понтонно-мостовая бригада и 1-й понтонно-мостовой полк — присвоением наименования Люблинских...» не соответствует действительности, т.к. наименование им было присвоено Лодзинских, а не Люблинских, чему есть документальное подтверждение.

- речь идет на самом деле, скорее всего, об ошибке какой-нибудь машинистки или наборщицы, для которых слово Люблинский - привычно, а слово Лодзинский - нужно еще разглядеть. Кстати, ту же ошибку мог сделать и сам автор, пробегая глазами источники, вместо того чтобы читать Плюс экономия на корректорах (купили спеллер, что вам еще нужно?).

Спасибо: 0 
Цитата Ответить
Ответов - 37 [только новые]





Не зарегистрирован
ссылка на сообщение  Отправлено: 07.04.05 03:10. Заголовок: Re: Ошибки в текстах


Зачем же отдельный файл? Ставите ссылку на комментарий и даете правильную версию. Или, если в двух словах можно - сразу в скобках.

Спасибо: 0 
Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 07.04.05 09:54. Заголовок: Re: Ошибки в текстах


1. Я не считаю наш век халтурным, и вообще как-то отличающимся в принципе от других веков. Достаточно почитать Гесиода с Екклезиастом, чтобы понять -- всё одно и то же. Поэтому часто встречающиеся сетования на тему «в наше нелёгкое время» или «эхе-хе, времена такие» -- считаю типичным конформизмом сетующего, который заранее подстелил себе соломку на тот случай, если придётся упасть в грязь лицом -- дескать, не виноват я, это век-волкодав такой у нас, набросилси-и... Это было общее рассуждение, не относящееся ни к кому на этом форуме конкретно.

2. Пагинация страниц очень важна, поэтому ей уделяется такое внимание. Она гораздо важнее, чем исправление ошибок первого рода -- потому что цифровой «образ» печатной книги конкретного издания должен делиться на страницы так же, как и оригинал. А опечатки-ошибки в данном случае не влияют на дальнейшее использование текста -- при цитировании их можно исправить, а вот номера страниц восстановить не получится.

У любой электронной библиотекой есть постоянный выбор -- выложить книгу с ошибками, доведя её до определённой приемлемой степени готовности, либо держать её до тех пор, пока они не будут все вычищены. Второе -- сугубый формализм, который требует таких же затрат, каких требует корректура при издании печатной книги, чего себе не могут позволить многие эл. библиотеки (всё-таки это, в основное, проекты энтузиастов). Когда я спрашивал читателей, что им больше по душе -- когда в месяц появляется 10 книг, вычищенных от и до, либо 30, с опечатками, все выбирали второе. Вот он, вокс попули, и не будем идти против шерсти.

3. Согласен, что если в тексте встречаются ошибки второго рода, т.е. фактические, исправлять их в тексте (заменять) не надо, а надо давать в виде комментария. Будем это делать так: надо придумать особый знак, например {=1} или ещё как, чтобы больше он ни к каким примечаниям не был привязан, выделять его особым цветом, и помещать в том же файле (app.html), что и обычные примечания. В данном случае от слова Люблинские , будет идти подобная ссылка на пояснение -- в чём ошибка, чем обоснована поправка и кто её сделал.


Спасибо: 0 
Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 26.05.05 18:16. Заголовок: Re:


Олег!
Ну что ж такое - ошибки вижу только после опубликования на сайте. Наверно это сила печатного слова.

Эрр Ф.-Ж. Артиллерия в прошлом, настоящем и будущем

Аннотация издательства: В настоящем труде французский ген. Эрр на основе опыта империалистической войны 1914–1918 гг. подвергает критическому рассмотрению все основные вопросы, касающиеся как техники, так равно тактики и организации артиллерии. Очертив происшедшую за время указанной войны эволюцию взглядов на использование артиллерии и попутно отметив вызванные этой эволюцией изменения в области материальной части и организации, автор выясняет, какова должна быть для будущей войны наилучшая система материальной части, а также организация артиллерии, и что было сделано в этом отношении после войны в главнейших армиях мира.


Меркац Ф. Германское войсковое руководство по пулеметному делу

Аннотация издательства: Из предисловия: Каждому строевому

т.е. дубель


Боевой устав пехоты Красной Армии (1942). Часть 2 (батальон, полк)

Правка моя, а ОКР не знаю чей - вы присылали когда-то файл



Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 09:07. Заголовок: Re:


amyatishkin пишет:
цитата
Ну что ж такое - ошибки вижу только после опубликования на сайте. Наверно это сила печатного слова.
Между прочим, неоспоримый факт. Со мной то же самое.

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 15:55. Заголовок: Re:


Это отражение монитора. А может - признак истинного арийца. :)

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 16:50. Заголовок: Re:


S.N.Morozoff пишет:
цитата
признак истинного арийца

Бр-р. Нехорошо звучит как-то...

Тогда давайте придеремся к курчавым вьющимся волосам - а что, похожи на еврейские....

Смерть фашизму! Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 17:10. Заголовок: Опечатка


юдей = людей (букву пропустил)

Герб страны блестит на
пряжке — Отразилось солнце в нем!
Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 17:24. Заголовок: Re:


tancist, "Иванов"

Хороший аватар, правда?! :) Вот ведь покою не дает!

"Иванов"
Зачем, спрашивается, посты удалять? Теперь про отражение в мониторе - вообще в воздухе висит! Нехорошо-с! Сами же начали...

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:05. Заголовок: работа над ошибками


Голубые глаза аватара - это линзы?

Герб страны блестит на
пряжке — Отразилось солнце в нем!
Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:05. Заголовок: работа над ошибками


при хорошем увеличении виден второй уровень тетриса. Или даже третий...

Герб страны блестит на
пряжке — Отразилось солнце в нем!
Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:07. Заголовок: Re:


S.N.Morozoff пишет:
цитата
Вот ведь покою не дает!
так если зеленым крипичом по голове - какой тут покой!

Герб страны блестит на
пряжке — Отразилось солнце в нем!
Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:09. Заголовок: Re:


"Иванов" пишет:
цитата
так если зеленым крипичом по голове - какой тут покой!
"Кирпичи - не кирпичи без пары-тройки бутылок!" :)

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:16. Заголовок: Re:


Красная звездочка!
и больше я вам, буржуинам, ничего не скажу!

Герб страны блестит на
пряжке — Отразилось солнце в нем!
Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:28. Заголовок: Re:


Это не звездочка - это знак качества на зеленом кирпиче. Что Вы хотите от WEB сжатия? Да и вообще - ребенок рисовал!

Нет, определенно, аватар был выбран правильный. :)

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 18:36. Заголовок: Re:


:)

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 27.05.05 21:28. Заголовок: Re:


S.N.Morozoff пишет:
цитата
6 "А" класс - ребенок рисовал

Да я уже в 8 лет модельки клеил, а тут...

Смерть фашизму! Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 28.05.05 14:01. Заголовок: Re:


tancist пишет:
цитата
Да я уже в 8 лет модельки клеил
И за сколько из тех, восьмилетних, Вам теперь не стыдно? То-то же (произносится отеческим тоном).

Спасибо: 0 
Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 28.05.05 14:55. Заголовок: Re:


Максим пишет:
цитата
И за сколько из тех, восьмилетних, Вам теперь не стыдно

Это уже другой вопрос.... :)

Смерть фашизму! Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 28.05.05 17:57. Заголовок: Re:


"Иванов" пишет:
цитата
так если зеленым крипичом по голове

и в другом месте:
цитата
Это не звездочка - это знак качества на зеленом кирпиче

Нужна ли лучше иллюстрация проблеме интерпретации? И отрицания очевидного факта (звездочка-то она звездочка, с пятью лучами, нечего за WEB прятаться).

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 02.06.05 11:59. Заголовок: опечатка Яндекса


если набрать в окне поиска имена людей Liz Driscall, Simon Greenall, Яндекс дает подсказку: translit? возможно, имелось в виду: «Лиц Дрыщалл, Симон Грееналл»


Герб страны блестит на
пряжке — Отразилось солнце в нем!
Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 07.06.05 11:15. Заголовок: Re:


Попов А.Ю. "Диверсанты Сталина". в биографической справке по Рабцевичу А.М. указано что умер он в 1961 г., а вышел на пенсию в 1963. Разведчик, конечно, но не до такой же степени!

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 07.06.05 15:20. Заголовок: Re:


А это так в тексте было. Вот.

Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 08.06.05 06:57. Заголовок: Re:


Значит дядя точно шпион!

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 08.06.05 11:38. Заголовок: Re:


nikola_ufa пишет:
цитата
дядя точно шпион

Мож я не прав, но Шпиён - это ИХ, а у НАС - разведчик!

Смерть фашизму! Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 08.06.05 15:13. Заголовок: Re:


Это да, это так.

Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 18.07.05 15:58. Заголовок: Книга про воздушную разведку


В оглавлении осталась ошибка OCR
"последнею наступления" вместо "послегнего"

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 18.08.05 12:40. Заголовок: Re:


Кстати, меня удивляет регулярный глюк распознавания (как мне кажется) - очень часто буква "о" в конце названий населенных пунктов превращается в "е": Сталине вместо Сталино, Волкове вместо Волково и т.п. Это касается не только Милитеры но и всего lib.ru. Интересно где глюк базируется?

Oleg "Romeo" Kirillov Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 18.08.05 15:42. Заголовок: Re:


2GvShAD_Romeo

Программа воспринимает слово как соответствующую фамилию. Вылавливать это сложно.

Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 18.08.05 15:54. Заголовок: Re:


То есть виновата не распознавалка, а проверялка? А если попробовать ее отключить?

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 18.08.05 16:16. Заголовок: Re:


Там сложнее становиться проверять. Т.е. если стоит "показывать максимум ошибок", то такое название (если в базе есть похожая фамилия) первый раз на странице подсвечивается на ошибке. А остальные разы может без подсветки идти. А если уменьшать уровень выявления ошибок - их будет в разы меньше показываться. Т.е. проверка сведется к фикции.

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 18.08.05 17:28. Заголовок: Re:


Кстати, то же самое имеет место при распознании иностранных фамилий, похожих на имена - Робертс похоже на Роберт и распознается как Роберте.

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 18.08.05 20:12. Заголовок: Re:


Вот интересно. На 5-м ридере и на газетном тексте Сталино - Сталине и тому подобные ошибки - далеко не норма. Как правило распознается верно. Характерные ошибки другие - "п" и "н", например, уже упомянутые "ею" и "его". То есть чистые ошибки распознавания букв из-за некачественной печати.

Я верю в законы природы. Все остальное меняется. Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 26.08.05 09:38. Заголовок: Re:


6 FReader: текст дрянной, но стабильно распознается "прочность" как "дрочность".

Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 30.09.05 10:54. Заголовок: Re:


Частенько еще "с" в конце слова читается как "е", особенно в буржуазных словах. Массово "Таймс" становится "Тайме". В книге Дэвидсона о Вьетнамской войне генерал Абрамс становится порой "Абраме" (таки-да? ), а Дин Раск - "Раек".

Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 30.09.05 10:56. Заголовок: Re:


Vitaliy пишет:
цитата
Массово "Таймс" становится "Тайме".
С "Таймсом" - точно. А аббревиатуру ВКП(б) Ридер еще ни разу на моей памяти не распознал правильно, во всяком случае в газетном тексте.

Я верю в законы природы. Все остальное меняется. Спасибо: 0 
Профиль Цитата Ответить





Не зарегистрирован
ссылка на сообщение  Отправлено: 01.10.05 10:31. Заголовок: Re:


Это проблема большинства английских фамилий, которые состоят из имени+"с" на конце. (Фактически ситуация та же, что и у пар Иванов-Иваново).
Но, теоретически, должна полегче решаться. Я вот никак собраться токо не могу:
Сканится из словаря англо-русского для школьников раздел с именами, распознается, добавляем "с" и вводим в Файнридерский словарь.

Спасибо: 0 
Профиль Цитата Ответить



Не зарегистрирован
ссылка на сообщение  Отправлено: 02.10.05 18:46. Заголовок: Re:


В предисловии к "Ледоколу":

Страшно было умереть, не написал этой книги

Нужно "не написав".

Спасибо: 0 
Профиль Цитата Ответить
Ответ:
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Имя, пароль:      зарегистрироваться    
Тему читают:
- участник сейчас на форуме
- участник вне форума
Все даты в формате GMT  3 час. Хитов сегодня: 1
Права: смайлы да, картинки да, шрифты да, голосования нет
аватары да, автозамена ссылок вкл, премодерация вкл, правка нет