Фундаментальная электронная библиотека "Флора и фауна"
|
|
m7876 | Дата: Среда, 24.03.2010, 07:39 | Сообщение # 1 |
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
| Крупное обновление библиотеки "Флора и фауна" ( http://herba.msu.ru/shipunov/school/sch-ru.htm , http://ashipunov.info/shipunov/school/sch-ru.htm ) -- 2128 книг. Flora Rossica Ледебура, много новых книг по грибам, новые тома "Флоры Западной Сибири" и многое другое. Спасибо всем помогавшим! Рад также сообщить, что "Бюллетень Московского Общества Испытателей Природы. Отдел Биологический" теперь доступен в виде полнотекстовых номеров, начиная с 1995 года. Кроме того, доступны полнотекстовые тома с 1829 по 1908 год. Все это стало возможным благодаря самоотверженной работе Н. Шнырева, Е. Глазуновой и С. Большакова. Адрес сайта журнала -- http://herba.msu.ru/russian/journals/bmsn/ Кроме того, обновился сайт журнала "Микология и фитопатология" -- http://herba.msu.ru/russian/journals/mif/ Теперь там гораздо больше полнотекстового материала.
|
|
| |
mhorn | Дата: Среда, 24.03.2010, 10:13 | Сообщение # 2 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Спасибо! Буду признателен, если в этой теме Вы будете сообщать об обновлениях Остается только пожалеть, что все djvu файлы Бюл. МОИП лишены текстового слоя... смущает также вот эта фраза: "исходные файлы уменьшены преобразованием в DjVu и удалением полутоновых иллюстраций" то есть картинки с изображениями живности удалены? Возникает резонный вопрос - это зачем? И часть ссылок на старые номера БМОИП - не работает (напр., эта: http://herba.msu.ru/russian/journals/bmsn/bulletin_moscou/1863.djvu )
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
m7876 | Дата: Среда, 24.03.2010, 10:52 | Сообщение # 3 |
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
| По поводу ссылки: щелкнул -- работает... Сервер просто перегружен, сразу не отзывается. По поводу старых номеров -- доступны PDF всех этих томов (там есть ссылка), так что DjVu помещены для тех, кто хочет качать с меньшими проблемами. Что же касается полутоновых иллюстраций, то на Google Books они сделаны настолько плохо, что об их потере сильно жалеть не стОит. А удалены были не "зачем", а "почему" -- JPX-кодирование в Google Books вызывает множество проблем с конвертацией.
|
|
| |
mhorn | Дата: Среда, 24.03.2010, 11:30 | Сообщение # 4 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Quote (m7876) По поводу ссылки: щелкнул -- работает... Сервер просто перегружен, сразу не отзывается. да - заглавная страница herba.msu.ru тоже через раз открывается Quote (m7876) По поводу старых номеров -- доступны PDF всех этих томов (там есть ссылка), так что DjVu помещены для тех, кто хочет качать с меньшими проблемами. Что же касается полутоновых иллюстраций, то на Google Books они сделаны настолько плохо, что об их потере сильно жалеть не стОит. А удалены были не "зачем", а "почему" -- JPX-кодирование в Google Books вызывает множество проблем с конвертацией. так может быть, есть смысл по-человечески эти таблицы отсканировать и вставить в те же djvu? насколько я представляю, во всех номерах 1829-1909 года картинок от силы несколько сотен наберется - как небольшая книга. Геморно, правда, все тома на этот счет смотреть - но польза очевидна У гугля же, к сожалению, невнятная сортировка файлов, одни и те же тома местами дублируются... Кстати, технический вопрос: БМОИП в гугле, как я вижу, находится через издателя editions:LCCN71229850 а как можно узнать код издателей других периодических изданий, чтобы их можно было как-то в гуглопоиске упорядочивать - а то если просто название забить то вылезут и все ссылки где это издание упоминается P.S. Да, а как насчет тестового слоя? его в БМОИП вставлять вообще не планируется?
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
m7876 | Дата: Среда, 24.03.2010, 21:31 | Сообщение # 5 |
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
| Quote > так может быть, есть смысл по-человечески эти таблицы отсканировать и вставить в те же djvu? Конечно, есть. Вы знаете кого-нибудь, кто за это возьмется? Хотя бы за составление перечня для сканирования? В этом случае я смогу отсканировать. Quote а как можно узнать код издателей других периодических изданий В Google Books очень плохой поиск. LCCN можно узнать в каталоге Библиотеки Конгресса http://catalog.loc.gov/ , но я пробовал его использовать для других изданий и это не помогло. Quote Да, а как насчет тестового слоя? его в БМОИП вставлять вообще не планируется? Сам не смогу, но с удовольствием приму любую помощь.
|
|
| |
mhorn | Дата: Пятница, 26.03.2010, 20:03 | Сообщение # 6 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Quote (m7876) Хотя бы за составление перечня для сканирования? В этом случае я смогу отсканировать. нужен ли специальный перечень? наверняка в каждом томе что-нибудь из иллюстраций да есть другое дело, что для успеха данной затеи хорошо бы иметь свободный доступ ко всем томам и шустрый сканер у Вас такие возможности есть? Quote (m7876) Сам не смогу, но с удовольствием приму любую помощь. я вполне могу прогнать djvu-файлы через 10й FR. В каком формате тогда надо сохранять получающиеся файлы?
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
m7876 | Дата: Суббота, 27.03.2010, 09:05 | Сообщение # 7 |
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
| Перечень нужен, потому что часть томов сканирована BHL, и там все нормально. А есть и комбинированные тома. Доступ и сканер есть до середины мая. Спасибо! Из FR для последующего внедрения в DjVu (через DjVu OCR) надо сохранять в формате проектов FR. Но я не уверен, что это будет работать с 10-кой. С FR8 все нормально, а про другие версии ходили противоречивые слухи.
|
|
| |
mhorn | Дата: Суббота, 27.03.2010, 11:21 | Сообщение # 8 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Quote (m7876) Перечень нужен, потому что часть томов сканирована BHL, и там все нормально это какие? те что на biodiversitylibrary? их там два если другие - то есть ли они в сети? в любом случае, тут скорее нужно знать список того что сканировано, уточнить, действительно ли там всё нормально (на biodiversitylibrary картинки обычно слишком пережаты) Quote (m7876) Спасибо! Из FR для последующего внедрения в DjVu (через DjVu OCR) надо сохранять в формате проектов FR. Но я не уверен, что это будет работать с 10-кой. С FR8 все нормально, а про другие версии ходили противоречивые слухи. я сейчас закинул на пробу распознаваться один том, потом выложу ссылку на проект. А 8й FR может загружать djvu напрямую? У нас в б-ке есть 8й, если с 10м не получится - то в принципе можно и с ними переговорить
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
mhorn | Дата: Суббота, 27.03.2010, 14:07 | Сообщение # 9 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| http://rghost.ru/1255144 вот - FR проект тома за 1877 год
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
m7876 | Дата: Воскресенье, 28.03.2010, 09:50 | Сообщение # 10 |
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
| Спасибо, но, к сожалению, DjVu OCR не работает с FR10. Ему нужны frf-файлы, а они в 10 версии полностью поменяли весь формат вывода. Лучше всего восьмерка. === На BHL два, но на archive.org есть DjVu бОльшего количества томов (http://www.archive.org/search.php?query=bulletin%20moscou%20AND%20mediatype%3Atexts), и я использовал их без обработки.Добавлено (28.03.2010, 09:50) --------------------------------------------- Проверил. Вот годы, где есть текстовый слой -- 1832, 1837, 1838, 1844, 1849, 1855, 1857, 1865, 1868, 1871, 1878, 1879, 1881, 1885, 1886, 1887, 1888, 1889, 1890, 1891, 1892, 1893, 1894, 1895, 1896, 1897, 1898, 1903, 1905, 1906, 1907, 1908. Но этот слой очень разного качества, иногда совершенно чудовищного (особенно если он русский, хотя есть и нормальный русский текст).
|
|
| |
|