Суббота, 04.12.2021
Форум Jurassic.ru
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Форум сайта JURASSIC.RU » Ссылки и информация » Интересные ссылки » Фундаментальная электронная библиотека "Флора и фауна"
Фундаментальная электронная библиотека "Флора и фауна"
m7876Дата: Среда, 24.03.2010, 07:39 | Сообщение # 1
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
Крупное обновление библиотеки "Флора и фауна" ( http://herba.msu.ru/shipunov/school/sch-ru.htm , http://ashipunov.info/shipunov/school/sch-ru.htm ) -- 2128 книг. Flora Rossica Ледебура, много новых книг по грибам, новые тома "Флоры Западной Сибири" и многое другое.

Спасибо всем помогавшим!

Рад также сообщить, что "Бюллетень Московского Общества Испытателей Природы. Отдел Биологический" теперь доступен в виде полнотекстовых номеров, начиная с 1995 года. Кроме того, доступны полнотекстовые тома с 1829 по 1908 год. Все это стало возможным благодаря самоотверженной работе Н. Шнырева, Е. Глазуновой и С. Большакова. Адрес сайта журнала -- http://herba.msu.ru/russian/journals/bmsn/

Кроме того, обновился сайт журнала "Микология и фитопатология" -- http://herba.msu.ru/russian/journals/mif/ Теперь там гораздо больше полнотекстового материала.

 
mhornДата: Среда, 24.03.2010, 10:13 | Сообщение # 2
Admin
Группа: Администраторы
Сообщений: 3596
Репутация: 0
Статус: Offline
Спасибо! Буду признателен, если в этой теме Вы будете сообщать об обновлениях

Остается только пожалеть, что все djvu файлы Бюл. МОИП лишены текстового слоя...
смущает также вот эта фраза: "исходные файлы уменьшены преобразованием в DjVu и удалением полутоновых иллюстраций"
то есть картинки с изображениями живности удалены? Возникает резонный вопрос - это зачем?

И часть ссылок на старые номера БМОИП - не работает (напр., эта: http://herba.msu.ru/russian/journals/bmsn/bulletin_moscou/1863.djvu )


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
m7876Дата: Среда, 24.03.2010, 10:52 | Сообщение # 3
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
По поводу ссылки: щелкнул -- работает... Сервер просто перегружен, сразу не отзывается.
По поводу старых номеров -- доступны PDF всех этих томов (там есть ссылка), так что DjVu помещены для тех, кто хочет качать с меньшими проблемами. Что же касается полутоновых иллюстраций, то на Google Books они сделаны настолько плохо, что об их потере сильно жалеть не стОит. А удалены были не "зачем", а "почему" -- JPX-кодирование в Google Books вызывает множество проблем с конвертацией.
 
mhornДата: Среда, 24.03.2010, 11:30 | Сообщение # 4
Admin
Группа: Администраторы
Сообщений: 3596
Репутация: 0
Статус: Offline
Quote (m7876)
По поводу ссылки: щелкнул -- работает... Сервер просто перегружен, сразу не отзывается.

да - заглавная страница herba.msu.ru тоже через раз открывается

Quote (m7876)
По поводу старых номеров -- доступны PDF всех этих томов (там есть ссылка), так что DjVu помещены для тех, кто хочет качать с меньшими проблемами. Что же касается полутоновых иллюстраций, то на Google Books они сделаны настолько плохо, что об их потере сильно жалеть не стОит. А удалены были не "зачем", а "почему" -- JPX-кодирование в Google Books вызывает множество проблем с конвертацией.

так может быть, есть смысл по-человечески эти таблицы отсканировать и вставить в те же djvu? насколько я представляю, во всех номерах 1829-1909 года картинок от силы несколько сотен наберется - как небольшая книга. Геморно, правда, все тома на этот счет смотреть - но польза очевидна

У гугля же, к сожалению, невнятная сортировка файлов, одни и те же тома местами дублируются...

Кстати, технический вопрос: БМОИП в гугле, как я вижу, находится через издателя editions:LCCN71229850
а как можно узнать код издателей других периодических изданий, чтобы их можно было как-то в гуглопоиске упорядочивать - а то если просто название забить то вылезут и все ссылки где это издание упоминается

P.S. Да, а как насчет тестового слоя? его в БМОИП вставлять вообще не планируется?


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
m7876Дата: Среда, 24.03.2010, 21:31 | Сообщение # 5
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
Quote
> так может быть, есть смысл по-человечески эти таблицы отсканировать и вставить в те же djvu?

Конечно, есть. Вы знаете кого-нибудь, кто за это возьмется? Хотя бы за составление перечня для сканирования? В этом случае я смогу отсканировать.
Quote
а как можно узнать код издателей других периодических изданий

В Google Books очень плохой поиск. LCCN можно узнать в каталоге Библиотеки Конгресса http://catalog.loc.gov/ , но я пробовал его использовать для других изданий и это не помогло.
Quote
Да, а как насчет тестового слоя? его в БМОИП вставлять вообще не планируется?

Сам не смогу, но с удовольствием приму любую помощь.
 
mhornДата: Пятница, 26.03.2010, 20:03 | Сообщение # 6
Admin
Группа: Администраторы
Сообщений: 3596
Репутация: 0
Статус: Offline
Quote (m7876)
Хотя бы за составление перечня для сканирования? В этом случае я смогу отсканировать.

нужен ли специальный перечень? наверняка в каждом томе что-нибудь из иллюстраций да есть
другое дело, что для успеха данной затеи хорошо бы иметь свободный доступ ко всем томам и шустрый сканер
у Вас такие возможности есть?

Quote (m7876)
Сам не смогу, но с удовольствием приму любую помощь.

я вполне могу прогнать djvu-файлы через 10й FR. В каком формате тогда надо сохранять получающиеся файлы?


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
m7876Дата: Суббота, 27.03.2010, 09:05 | Сообщение # 7
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
Перечень нужен, потому что часть томов сканирована BHL, и там все нормально. А есть и комбинированные тома.
Доступ и сканер есть до середины мая.
Спасибо! Из FR для последующего внедрения в DjVu (через DjVu OCR) надо сохранять в формате проектов FR. Но я не уверен, что это будет работать с 10-кой. С FR8 все нормально, а про другие версии ходили противоречивые слухи.
 
mhornДата: Суббота, 27.03.2010, 11:21 | Сообщение # 8
Admin
Группа: Администраторы
Сообщений: 3596
Репутация: 0
Статус: Offline
Quote (m7876)
Перечень нужен, потому что часть томов сканирована BHL, и там все нормально

это какие? те что на biodiversitylibrary? их там два
если другие - то есть ли они в сети?
в любом случае, тут скорее нужно знать список того что сканировано, уточнить, действительно ли там всё нормально (на biodiversitylibrary картинки обычно слишком пережаты)

Quote (m7876)
Спасибо! Из FR для последующего внедрения в DjVu (через DjVu OCR) надо сохранять в формате проектов FR. Но я не уверен, что это будет работать с 10-кой. С FR8 все нормально, а про другие версии ходили противоречивые слухи.

я сейчас закинул на пробу распознаваться один том, потом выложу ссылку на проект. А 8й FR может загружать djvu напрямую?
У нас в б-ке есть 8й, если с 10м не получится - то в принципе можно и с ними переговорить


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
mhornДата: Суббота, 27.03.2010, 14:07 | Сообщение # 9
Admin
Группа: Администраторы
Сообщений: 3596
Репутация: 0
Статус: Offline
http://rghost.ru/1255144

вот - FR проект тома за 1877 год


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
m7876Дата: Воскресенье, 28.03.2010, 09:50 | Сообщение # 10
Группа: Проверенные
Сообщений: 32
Репутация: 0
Статус: Offline
Спасибо, но, к сожалению, DjVu OCR не работает с FR10. Ему нужны frf-файлы, а они в 10 версии полностью поменяли весь формат вывода. Лучше всего восьмерка.
===
На BHL два, но на archive.org есть DjVu бОльшего количества томов (http://www.archive.org/search.php?query=bulletin%20moscou%20AND%20mediatype%3Atexts), и я использовал их без обработки.

Добавлено (28.03.2010, 09:50)
---------------------------------------------
Проверил. Вот годы, где есть текстовый слой -- 1832, 1837, 1838, 1844, 1849, 1855, 1857, 1865, 1868, 1871, 1878, 1879, 1881, 1885, 1886, 1887, 1888, 1889, 1890, 1891, 1892, 1893, 1894, 1895, 1896, 1897, 1898, 1903, 1905, 1906, 1907, 1908. Но этот слой очень разного качества, иногда совершенно чудовищного (особенно если он русский, хотя есть и нормальный русский текст).

 
Форум сайта JURASSIC.RU » Ссылки и информация » Интересные ссылки » Фундаментальная электронная библиотека "Флора и фауна"
  • Страница 1 из 1
  • 1
Поиск:

jurassic.ru © 2021