Автор | Сообщение |
|
Отправлено: 25.10.05 17:32. Заголовок: Архивы возвращаются...
В продолжение: ответ Анике-воину. Их штатных человек семь. Вообще если интересно, я могу уточнить - потому как последние точные сведения мои двухлетней давности, а с тех пор они заметно расширили регион работ как минимум. В частности, в Коми я в этом году ездил по их договору. Вот наш местный Неназываемый появится... С бюджетом там вообще своеобразно: это общественная природоохранная программа, часть народу там на нескольких работах - ну как обычно...
|
|
Профиль
Цитата
|
Ответов - 48
, стр:
1
2
All
[только новые]
|
|
|
Отправлено: 25.10.05 17:52. Заголовок: Re:
Michail Tz пишет: цитата С бюджетом там вообще своеобразно: это общественная природоохранная программа, часть народу там на нескольких работах - ну как обычно...
Понятно. Тридцать тысяч - это официальные пожертвования: Минфину - в рублях, себе - в терабайтах. Лучше не называть. Пусть работают. Интересно, как американцы поддерживают свою трехмерную модель земной поверхности? И сколько дисков на это уходит?
|
|
Профиль
Цитата
|
|
Отправлено: 25.10.05 18:13. Заголовок: Re:
Michail Tz пишет: цитата С бюджетом там вообще своеобразно: это общественная природоохранная программа, часть народу там на нескольких работах - ну как обычно...
Так сколько Вы там насчитали на машинную часть? А теперь прибавьте сюда задачу по резервному копированию, доступу и т.д. Я так думаю что миллионов 10 минимум на это все дело уйдет. Но это еще затраты так себе. Основная задача - это сканирование и обработка. А вот это попахивает уже сотнями лимонов.
|
|
Цитата
|
|
Отправлено: 25.10.05 19:18. Заголовок: Re:
Ну вот за машинную часть того проекта я ответить могу. Шесть компов класса Barton с гигом оперативки, стомегабитная сетка, айдевые харды. Основная масса данных лежит на DVD, их там тысячи (не преувеличиваю). Работает простая база данных: при обращении к проекту выдается ID диска. Проект лежит на сервере, который суть седьмая машина, в последний раз был двухпроцессорный Хьюлет (два Р-2 233) с программным райдом на восьми скази-дисках, всего гигов восемьдесят. Понятное дело, без публикации в Инете, им того и не надо. Хардов много, и вечно не хватает, это правда. Штуки по три-четыре на машину. Таким образом, машинная часть проекта - это тысяч двадцать в самом верхнем пределе. Реально где в архиве найдут шестерых оцифровщиков? Двоих бы найти... Карты, кстати говоря, они сканируют сами, привязка карт и снимков тоже своя. Цветоделение. Перетягивание снимков в нужную проекцию. Компоновка и расширение общего проекта. Что на сканирование и обработку вполне тянет. С софтом у них проще - им он выдан бесплатно как благотворительная акция (неоднократная). ИМХО, возвращаясь к архиву, для старта такого проекта и работы его же в течении первых нескольких лет хватит пары грантов РФФИ. Пройти, кстати, должны на раз. Под такое-то великое дело. Если архив имеет право подавать заявки в РФФИ, естественно. Сие может, даже стоит узнать... В общем, если не говорить сразу о миллионах документов, а о работе по оцифровке - не миллионы это. Совсем даже. Тем более, что реально глядя на вещи, в Инет класть имеет смысл только верхушку айсберга: документы союзного и республиканского (Генштаба и фронтовые) значения. Да и то небось не все... Остальное может смело ждать до морковкиных заговений - нехай лежат на DVD себе, буде даже отсканены и ждут... Главное, что дело сдвинется с мертвой точки...
|
|
Профиль
Цитата
|
|
Отправлено: 25.10.05 19:23. Заголовок: Re:
Michail Tz Спасибо. Просто хотелось сравнить большой архив с чем-то таким же большим и постоянно обновляемым. Главное сдвинуть с места.
|
|
Профиль
Цитата
|
|
Отправлено: 25.10.05 19:31. Заголовок: Re:
Michail Tz пишет: цитата Тем более, что реально глядя на вещи, в Инет класть имеет смысл только верхушку айсберга: документы союзного и республиканского (Генштаба и фронтовые) значения.
1. Эта информация интересует максимум тысяч 10.000 человек (а то и меньше) в России и за ее пределами. 2. На 90% (от объема) эта информация до сих пор находится на секретном хранении, и большая ее часть будет там находится еще лет 10-20 (шифровки, мобдокументы и т.п.). 3. Начинать нужно с информации, которая НУЖНА большему количеству людей, что сейчас и происходит - создании баз данных по погибшим. 4. Кроме процесса создания еще нужно поддерживать в рабочем состоянии все это добро, что в нынешних условиях практически невозможно (по многим обстоятельствам).
|
|
Цитата
|
|
Отправлено: 25.10.05 22:11. Заголовок: Re:
Т.е. Вы не просто потоковый ввод (скан) предлагаете. А еще и качественную классификацию? Это, знаете ли на хороший исторический институт потянет. Как минимум
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 11:09. Заголовок: Re:
Сергей: Про нынешние условия все и так понятно... Олег Кириллов написал про это достаточно ясно. Про создание баз данных по погибшим не знал. Mea culpa. Если это делается, то значительная часть лично моих претензий снимается. Abv: в архиве классификация есть ведь? Придерживаясь ее, уже можно работать. А создавать институт под классификацию - спасибо, не надо. Проходили. В другом месте и не в то время (с), но проходили... Упаси господи.
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 11:18. Заголовок: Re:
Michail Tz пишет: цитата А создавать институт под классификацию - спасибо, не надо. Проходили.
Угу. Только создадут ведь. Идеальный вариант - если поручат существующему, но он тоже выбьет себе под это денег.
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 11:40. Заголовок: Re:
Так я потому и написал, что тоже проходил (и периодически меня в ту же реку толи пригласить, то ли спихнуть пытаются )
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 12:17. Заголовок: Re:
Abv пишет: цитата ак я потому и написал, что тоже проходил
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 12:26. Заголовок: Re:
Пью здоровье всех архивистов и их информационщиков (кто не пьет - может закурить)
|
|
Профиль
Цитата
|
|
|
Отправлено: 26.10.05 12:29. Заголовок: Re:
Сергей пишет: цитата 3. Начинать нужно с информации, которая НУЖНА большему количеству людей, что сейчас и происходит - создании баз данных по погибшим.
Начинать нужно с документов, которые первыми должны быть уничтожены по ветхости, невозможности обеспечить условия хранения или иным причинам. К сожалению есть и такие. Что может подождать - подождет. Что не может - будет потеряно безвозвратно.
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 12:31. Заголовок: Re:
Abv: Легко...
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 12:45. Заголовок: Re:
2GvShAD_Romeo пишет: цитата Начинать нужно ...
А Вы говорите - существует. Если даже здесь - такие разные мнения с чего начинать - для специалиста-кодификатора - просто непочатый край работ Michail Tz Еще только середина рабочего дня. Не увлекайтесь
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 12:46. Заголовок: Re:
Abv пишет: цитата Пью здоровье всех архивистов и их информационщиков (кто не пьет - может закурить)
"Тихо должно быть в библиотеке!" (с)
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 13:17. Заголовок: Re:
Энциклоп пишет: цитата "Тихо должно быть в библиотеке!"
Пьем не чекаясь
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 13:36. Заголовок: Re:
2GvShAD_Romeo пишет: цитата Начинать нужно с документов, которые первыми должны быть уничтожены по ветхости, невозможности обеспечить условия хранения или иным причинам. К сожалению есть и такие. Что может подождать - подождет. Что не может - будет потеряно безвозвратно.
В таком случае нужно делать НАДЛЕЖАЩИЕ условия хранения, что будет ДЕШЕВЛЕ.
|
|
Цитата
|
|
Отправлено: 26.10.05 14:20. Заголовок: Re:
Сергей - я не уверен, что это дешевле... Вентиляция, борьба с влажностью, температурный режим, периодическое облучение ультрафиолетом, обработка фиксирующими составами... проблема сохранности бумажных документов в мире окончательно разрешенной не считается. А ведь некоторые специфические проблемы хранилищ связаны со свойствами здания и без замены здания фактически неразрешимы. Мать моего друга, из историко-архивного института, рассказывала мне, что долгое время всякие "неблагонадежные" документы из их архива забирали в спецхран. А когда кто-то под перестройку попробовал из спецхрана их получить обратно... Нет, их выдали, даже без особых препон и проволочек. Только под густым слоем плесени различимого текста уже не было... * * * Супротив того, сканирование с записью на оптические носители удельно стоит весьма недорого. Комп, сканер, резак, ставка двух лаборантов (один разбирает, другой сканирует) и болванки. И все. Время сканирования на ОЧЕНЬ фиговом сканере с USB 1.0 листа А4 на 300dpi в RGB составляет 110 секунд, сейчас специально проверили. Сотню листов в день довести до состояния записанной болванки (в указанном режиме на сто листов болванок будет полторы) даже на нем вполне реально. Я понимаю, что при указанной схеме на сканирование всех десяти миллионов единиц хранения уйдут сотни лет - но сейчас мы говорим про первоочередные нужды? 2GvShAD_Romeo, для интереса не можете оценить?
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 14:35. Заголовок: Re:
Michail Tz пишет: цитата Сергей - я не уверен, что это дешевле... Вентиляция, борьба с влажностью, температурный режим, периодическое облучение ультрафиолетом, обработка фиксирующими составами... проблема сохранности бумажных документов в мире окончательно разрешенной не считается. А ведь некоторые специфические проблемы хранилищ связаны со свойствами здания и без замены здания фактически неразрешимы.
Но это все равно нужно делать и это делается. А сканирование документов, да еще и выкладывание всего этого добра в интернете ..... Michail Tz пишет: цитата Мать моего друга, из историко-архивного института, рассказывала мне, что долгое время всякие "неблагонадежные" документы из их архива забирали в спецхран. А когда кто-то под перестройку попробовал из спецхрана их получить обратно... Нет, их выдали, даже без особых препон и проволочек. Только под густым слоем плесени различимого текста уже не было...
Не поясните мне, что такое "спецхран"? Michail Tz пишет: цитата Супротив того, сканирование с записью на оптические носители удельно стоит весьма недорого. Комп, сканер, резак, ставка двух лаборантов (один разбирает, другой сканирует) и болванки. И все. Время сканирования на ОЧЕНЬ фиговом сканере с UCB 1.0 листа А4 на 300dpi в RGB составляет 110 секунд, сейчас специально проверили. Сотню листов в день довести до состояния записанной болванки (в указанном режиме на сто листов болванок будет полторы) даже на нем вполне реально.
Очень даже ошибаетесь: 1. Документы хранятся не в разбранном виде, а сшитыми в дела (дело нужно расшить, затем сшить). 2. Наверняка придется под некоторые документы перенастривать настройки сканирования (так как документы разного качества, а если Вы все будете сканировать с 600 т/д, то ...., во сколько раз там увеличится объем информации?) 3. Со 110 секундами Вы ошибаетесь - еще время на перекладывание добавьте. Могу сказать так - 12 млн карточек погибших (лист формата половина А4 с двух сторон) с распознаванием требуют около года работы и 800 тысяч долларов (минимальный расчет).
|
|
Цитата
|
|
Отправлено: 26.10.05 14:40. Заголовок: Re:
Меня заинтересовала идея измерить свой труд в сравнении с предполагаемым объемом архива ЦАМО (измерить свой рост в попугаях). Из интереса пересчитал сканерные проходы (без фото и вообще цветных материалов, только сканы полос). Получилось на данный момент 2624 листа формата А4, то есть, примерно 8,75 единиц хранения (из расчета 300 листов на единицу). Понятно, что сканирую я не от забора до обеда, кроме того, куски полос нужно свести в одно целое, распознать, сверстать, отсканить отдельно фото (RGB на том самом сканере - см. выше) и подготовить их к публикации. Это все не учитывается. Michail Tz Вы бы, молодой человек, вместо того, чтобы объемы чужой работы измерять, занялись бы делом - газетку бы хоть одну отсканировали что ли... :))))
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 14:57. Заголовок: Re:
Сергей Да шайтан с ним, с Интернетом... Поворчали и будет. В любом случае перевод в цифровой вид является задачей более высокого приоритета. Что такое "спецхран" точнее сказать не могу, что слышал от С.И., то и высказал один в один. Далее: Сергей пишет: цитата 1. Документы хранятся не в разбранном виде, а сшитыми в дела (дело нужно расшить, затем сшить). 2. Наверняка придется под некоторые документы перенастривать настройки сканирования (так как документы разного качества, а если Вы все будете сканировать с 600 т/д, то ...., во сколько раз там увеличится объем информации?) 3. Со 110 секундами Вы ошибаетесь - еще время на перекладывание добавьте.
По п. 1 - для того и две лаборантские ставки :) По п. 2 - да пусть себе будет безобразно, но единообразно - потом обрабатывать будет проще, если файлы однотипные. По п. 3 - Сто листов в день считались мною как пять часов непрерывного сканирования из расчета три минуты на лист. Вот только разрешение я считал, как 300, а не как 600...
|
|
Профиль
Цитата
|
|
|
Отправлено: 26.10.05 14:59. Заголовок: Re:
Планшетный сканер там не лучший помощник. Часть документов можно и на нем, но лучше установить цифровой фотоаппарат на штативе (вертикальном), с автоматическим сбросом на компьютер. Время экспозиции - секунда, удаленный отраженный свет позволяет справиться с просвечивающими с обратной стороны буквами. Некоторое время нужно помощнику чтобы быстренько проверить качество снимка и дать имя файлу (за это время снимающий успеет сменить страницу). Ну, секунд 15. Качество, конечно, не как у планшетника, но отнюдь не все документы требуют его, а с некоторыми может получиться и хуже. Стоимость цифровичка и писюка с двумя-тремя резаками (копии лучше делать сразу) любой может оценить по price.ru.
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 15:05. Заголовок: Re:
Michail Tz пишет: цитата По п. 2 - да пусть себе будет безобразно, но единообразно - потом обрабатывать будет проще, если файлы однотипные.
А зачем такое надо? Одно дело когда сканируется машинопись с хорошим отпечатком, другое дело когда сканируется рукописная записка выполненная простым карандашом. Между ними много промежуточных позиций - разный формат документа, документы с различными подписями (сделанными различными пишущими предметами) и резолюциями, и т.д. Без сохранения всех особенностей документа - нафиг нужно это сканирование.
|
|
Цитата
|
|
Отправлено: 26.10.05 15:09. Заголовок: Re:
2GvShAD_Romeo пишет: цитата Планшетный сканер там не лучший помощник. Часть документов можно и на нем, но лучше установить цифровой фотоаппарат на штативе (вертикальном), с автоматическим сбросом на компьютер. Время экспозиции - секунда, удаленный отраженный свет позволяет справиться с просвечивающими с обратной стороны буквами. Некоторое время нужно помощнику чтобы быстренько проверить качество снимка и дать имя файлу (за это время снимающий успеет сменить страницу). Ну, секунд 15.
Ну это Вы загнули - 15 секунд на кадр. Сами так пробовали снимать? Кроме того, результат такой съемки можно наблюдать сейчас в архиве - многие дела выдаются на микрофильмах, которые снимались на одной установке. И что- некоторые страницы практически не читаемы.
|
|
Цитата
|
|
Отправлено: 26.10.05 15:10. Заголовок: Re:
Не поверите - в конце 80х - начале 90х был проект Государственного Архива (Правительство, министерства,...). С микрофильмованием всех принимаемых на хранение док-в. В начале 2000х - реанимирован (уже с расчетом на сканирование и хранение электронных копий). Правда, как сейчас как там дела - не в курсе
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 16:10. Заголовок: Re:
Кому как, а мне 15 секунд вполне достаточно. Один кладет оригинал, второй снимает и просматривает что получилось на экране. Ну хорошо, допустим мы с напарником пыхнули и нам требуется полминуты на 1 кадр. :) Все равно быстрее чем со сканером, почти в 4 раза. Отличие от микрофильмирования в том, что при микрофильмировании нельзя сразу оценить качество снимка. С цифровиком - можно. И тут же переснять, если надо. Нечитаемые микрофильмы могут восстановить криминалисты, у них метода есть специальная.
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 16:17. Заголовок: Re:
Мне тут напомнили... Пробовали работать с фотоаппаратом (цифровым). На 2000 кадров (плюс-минус, точно не скажу), с созданием электронной карточки, внесением в реестр,... ушло ДВЕ НЕДЕЛИ. При этом - работали без перекуров по полчаса, но с пересниманием, если с первого раза не вышло Кадр - лист А4, в основном печатный текст Правда - сначала искали в базе карточку, но это уже - мелочи
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 16:26. Заголовок: Re:
Abv пишет: цитата Мне тут напомнили... Пробовали работать с фотоаппаратом (цифровым). На 2000 кадров (плюс-минус, точно не скажу), с созданием электронной карточки, внесением в реестр,... ушло ДВЕ НЕДЕЛИ. При этом - работали без перекуров по полчаса, но с пересниманием, если с первого раза не вышло Кадр - лист А4, в основном печатный текст Правда - сначала искали в базе карточку, но это уже - мелочи
25 кадров в час - уже более или менее близко к истине.
|
|
Цитата
|
|
Отправлено: 26.10.05 16:36. Заголовок: Re:
Сергей пишет: цитата 25 кадров в час - уже более или менее близко к истине.
Старались...
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 16:51. Заголовок: Re:
Насчет цифровки. В Британии в 1986 году решили оцифровать "Книгу Судного дня". Ей как раз 900 лет исполнилось. Оцифровали, мультимедии напихали, записали на лазерки, все путем. А пару лет назад спохватились - оказалось, ни одного компьютера, на котором это прочитать можно, уже не осталось. Диски-то еще нашли, проигрыватели под них тоже, а компьютеров нема. Пришлось конструировать железо, писать эмулятор и все такое прочее - только чтоб переписать. А вы - цыфра, цыфра...
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 17:06. Заголовок: Re:
А что они с ней 20 лет делали? На просвет любовались?
|
|
Профиль
Цитата
|
|
|
Отправлено: 26.10.05 17:19. Заголовок: Re:
Руки у англичан видать росли значительно ниже плеч. К примеру я когда видео на винт сливаю, кладу его без кодека, как есть. А после финиша проекта все исходники закатываю на 2-3 DVD, вдруг потребуются? На полке лежит, каши не просит, места в каталогизаторе занимает копейки. Предполагаю, что рано или поздно DVD-привод будет заменен на что-нибудь более совершенное, но у меня уже есть опыт переезда с Jaz, так что не проблема. А для запуска старых операционок у меня VMWare имеется.
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 17:26. Заголовок: Re:
Была история, даже Компьютерра писала... Только вот фокус в том, что там (похоже) тоже деньгу отмыть решили. Или просто дурость сваляли: компьютер вместе с носителями, ПО и форматом записи под это дело разрабатывался свой. Нестандартный. Да и стандарты тогда еще не устаканились, имели место разброд и шатание. РС тогда пешком под стол ходили, а закрытые коммерческие архитектуры воевали между собой. Если МО оцифровку будет на "Эльбрусах" вести, в порядке поддержки отечественного производителя - может что-то подобное получиться. Если возьмут нормальные компы, это уже исключено. Стандарт есть стандарт. Вон, пожалуйста: возьмите и вставьте в дисковод дискетку, хоть под третьим ДОСом записанную: если физика цела, данные вы получите. Разве что разработают свой формат записи, или базу сваяют совсем свою... (мысли в сторону: а ведь могут, нехорошие люди...)
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 17:30. Заголовок: Re:
Michail Tz пишет: цитата а ведь могут, нехорошие люди...
Ой, могут
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 17:32. Заголовок: Re:
Michail Tz пишет: цитата Вон, пожалуйста: возьмите и вставьте в дисковод дискетку
ага, дисковод 18" тоже рядом держать на всякий случай?
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 17:37. Заголовок: Re:
"Иванов" пишет: цитата дисковод 18" тоже рядом держать
Ага, с тройным комплектом фугасных дискет
|
|
Профиль
Цитата
|
|
Отправлено: 26.10.05 17:48. Заголовок: Re:
|
|
Профиль
Цитата
|
|
Отправлено: 27.10.05 06:18. Заголовок: Re:
Советы постороннего Лучше бы утащили и скинули в сеть 20-томную Историю Великой Отечественной Войны. Может хватит ее в спецхране держать? Смешно уже. Я читал из нее отрывки о немецких полевых укреплениях, очень занимательно. Все равно ее переводит Cassell на английский, так что "у них" она уже есть.
|
|
Профиль
Цитата
|
|
Отправлено: 27.10.05 08:19. Заголовок: Re:
dracobooks.com пишет: цитата Смешно уже
Нашего пОлку прибыло! Если тебе 20 лет и ты не коммунист, у тебя нет сердца. Если тебе 30 лет и ты коммунист, у тебя нет разума.
|
|
Профиль
Цитата
|
|
Отправлено: 27.10.05 17:39. Заголовок: Re:
По существующему закону о федеральных архивах (как мне сегодня объяснили) они обязаны предоставлять информацию (пускать в открытые фонды) гражданам (физ лицам), только при наличии подписанного запроса. Если запрос НЕ подписан - он считается анонимным и ответ на него не дается. Так что до появления закона об электронной подписи - работу по сканированию можно, конечно, начинать, но вот выкладывать в общий доступ - преждевременно
|
|
Профиль
Цитата
|
Ответов - 48
, стр:
1
2
All
[только новые]
|
|