Пятница, 19.04.2024
Форум Jurassic.ru
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Форум сайта JURASSIC.RU » О форуме и сайте » Общая информация, ответы и вопросы » Кто-нибудь знает, что делать с кодировкой текста? (...коллективный ум - против pdf'ов МАИК Наука/Интерпериодика)
Кто-нибудь знает, что делать с кодировкой текста?
AlexIppДата: Пятница, 16.01.2009, 01:44 | Сообщение # 1
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
Всем желающим - чисто техническая задачка wink
Quote (mhorn)
UPD. Меня совершенно изумляет то, в каком формате МАИК Наука/Интерпериодика распространяет пдфы авторам (и в каком, подозреваю, их и продаёт). Дело в том, что если попытаться скопировать из такого офиц. пдфа русский текст, вылезает абракадабра. Примерно такая:
é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae.
Что "переводится" так: Обосновывается самостоятельность рода и его отнесение к семейству Cardioceratidae.
Это значит, что пдф по большому счёту годен только для того, чтобы с него сделать распечатку (причем для этого нужно в настройках печати отметить, чтобы пдф печатался как картинка (где и как это делать - знают далеко не все) - а то и на печати такая же хрень может появиться - смотря как принтер настроен). А работать с ним как с полноценной электронной статьёй невозможно в принципе! И статью надо заново прогонять через файнридер!!!!

Есть идеи? Что сделать с файлами (помимо предложенного перераспознания), чтобы с их текстовым содержимым можно было полноценно работать? sad
Подопытный файл:
http://file.qip.ru/file....1_.html

Сообщения #2-4 перенесены из темы http://jurassic.ucoz.ru/forum/8-451-1


всё о серпулидах & белемнитах
 
AlexIppДата: Пятница, 16.01.2009, 01:44 | Сообщение # 2
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
Quote (mhorn)
Меня совершенно изумляет то, в каком формате МАИК Наука/Интерпериодика распространяет пдфы авторам (и в каком, подозреваю, их и продаёт). Дело в том, что если попытаться скопировать из такого офиц. пдфа русский текст, вылезает абракадабра. Примерно такая:
é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae.
Что "переводится" так: Обосновывается самостоятельность рода и его отнесение к семейству Cardioceratidae.

Ты знаешь, я думал, здесь проблемы со шрифтами, ан нет. Это какая-то хитрая кодировка по умолчанию у них стоит.
Частично текст удалось восстановить с помощью Штирлица

PS. Но даже сам Штирлиц (!) не смог полностью эту абракадабру переварить


всё о серпулидах & белемнитах
 
ЮстасДата: Пятница, 16.01.2009, 01:44 | Сообщение # 3
Группа: Проверенные
Сообщений: 14
Репутация: 0
Статус: Offline
Quote (mhorn)
UPD. И ещё. Меня совершенно изумляет то, в каком формате МАИК Наука/Интерпериодика распространяет пдфы авторам (и в каком, подозреваю, их и продаёт). Дело в том, что если попытаться скопировать из такого офиц. пдфа русский текст, вылезает абракадабра. Примерно такая: é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae. Что "переводится" так: Обосновывается самостоятельность рода и его отнесение к семейству Cardioceratidae. Это значит, что пдф по большому счёту годен только для того, чтобы с него сделать распечатку (причем для этого нужно в настройках печати отметить, чтобы пдф печатался как картинка (где и как это делать - знают далеко не все) - а то и на печати такая же хрень может появиться - смотря как принтер настроен). А работать с ним как с полноценной электронной статьёй невозможно в принципе! И статью надо заново прогонять через файнридер!!!!

У меня почему-то никаких проблем с копированием текста.
(Акробат 8.0 Pro, Foxit 2.3)
Полагаю, дело не в пдф'е.

 
AlexIppДата: Пятница, 16.01.2009, 01:45 | Сообщение # 4
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
Quote (Юстас)
У меня почему-то никаких проблем с копированием текста.
(Акробат 8.0 Pro, Foxit 2.3)
Полагаю, дело не в пдф'е.

Юстас, дело в том, что в старой теме (см. выше) mhorn выложил уже перераспознанную FineReader'ом статью. А тот файл, по поводу которого он возмущался - в первом сообщении данной темы


всё о серпулидах & белемнитах
 
EcologДата: Пятница, 16.01.2009, 19:00 | Сообщение # 5
Группа: Проверенные
Сообщений: 123
Репутация: 0
Статус: Offline
Мне кроме вариантов
1. распознать Файнридером или
2. раздобыть где-то эти редкие шрифты
ничего в голову не приходит


Любитель аммонитов и прочих головоножек
 
mhornДата: Пятница, 16.01.2009, 20:18 | Сообщение # 6
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
Quote (Ecolog)
2. раздобыть где-то эти редкие шрифты

это шрифт Times-Pandre-Light
удивительно, но поиск гуглем привел лишь на форум тех, которые тоже имеют с этим шрифтом проблемы

загадка: почему используется такой извращенный шрифт?


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
AlexIppДата: Пятница, 16.01.2009, 21:06 | Сообщение # 7
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
Quote (mhorn)
это шрифт Times-Pandre-Light
удивительно, но поиск гуглем привел лишь на форум тех, которые тоже имеют с этим шрифтом проблемы
загадка: почему используется такой извращенный шрифт?

Не понял, причем тут шрифт. Вот я делаю водяные знаки шрифтом OldredFull No.7, которого у тебя нет в 7 Акробате - и что, ты их не видишь??? Вроде нет проблем...
И если бы дело было в шрифте, то почему тогда программа для смены кодировки частично восстановила текст? К тому же, насколько я знаю, вместо неизвестных шрифтов печатается не абра, а белые прямоугольнички. Всегда
По поводу шрифта самый простой способ - спросить в редакции, какой прогой они пользуются, набор шрифтов ведь у каждой свой wink


всё о серпулидах & белемнитах
 
mhornДата: Пятница, 16.01.2009, 21:55 | Сообщение # 8
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
Quote (AlexIpp)
Не понял, причем тут шрифт. Вот я делаю водяные знаки шрифтом OldredFull No.7, которого у тебя нет в 7 Акробате - и что, ты их не видишь??? Вроде нет проблем...

это потому что надпись-то - латиницей. Вон, в этой абракадабре Cardioceratidae нормально написались

Quote (AlexIpp)
К тому же, насколько я знаю, вместо неизвестных шрифтов печатается не абра, а белые прямоугольнички. Всегда

это в ворде, там .ttf-шные шрифты, а этот - наверняка ещё какой-нибудь

Quote (AlexIpp)
По поводу шрифта самый простой способ - спросить в редакции, какой прогой они пользуются, набор шрифтов ведь у каждой свой

в редакции раньше пользовались печатной машинкой smile
теперь - вордом

а вот в издательство МАИК Наука/Интерпериодика я письмецо накатаю обязательно


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
AlexIppДата: Пятница, 16.01.2009, 22:12 | Сообщение # 9
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
Quote (mhorn)
это потому что надпись-то - латиницей. Вон, в этой абракадабре Cardioceratidae нормально написались

во, именно поэтому-то дело не в шрифте (иначе бы все символы НЕ читались!), а в типе кодировки русскоязычных символов


всё о серпулидах & белемнитах
 
EcologДата: Четверг, 22.01.2009, 23:54 | Сообщение # 10
Группа: Проверенные
Сообщений: 123
Репутация: 0
Статус: Offline
Quote
Не понял, причем тут шрифт. Вот я делаю водяные знаки шрифтом OldredFull No.7, которого у тебя нет в 7 Акробате - и что, ты их не видишь??? Вроде нет проблем...

Дело точно в шрифтах - ведь акробатовские файлы хранят шрифты в себе (от настроек зависит, но тут именно так) и в принципе этого удивительного шрифта может не быть нигде, кроме как у автора файла, но файл будет везде читаться. Читаться, но не копироваться.

Так что надо либо искать шрифт, либо его как-то выдрать из файла, но я таких методов не знаю, а гугленье адекватных программок не принесло.


Любитель аммонитов и прочих головоножек
 
AlexIppДата: Пятница, 23.01.2009, 00:19 | Сообщение # 11
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
Quote (Ecolog)
Дело точно в шрифтах - ведь акробатовские файлы хранят шрифты в себе (от настроек зависит, но тут именно так) и в принципе этого удивительного шрифта может не быть нигде, кроме как у автора файла

... только почему тогда англоязычные символы читаются, в отличие от русскоязычных??


всё о серпулидах & белемнитах
 
mhornДата: Воскресенье, 20.06.2010, 09:30 | Сообщение # 12
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
то ли в МАИК Наука/Интерпериодика заходят на наш форум, то ли им многие про кривые шрифты написали - так или иначе, в публикациях этого года всё ОК, и кириллица запросто копируется

верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
cattyДата: Четверг, 01.07.2010, 16:23 | Сообщение # 13
Группа: Проверенные
Сообщений: 78
Репутация: 0
Статус: Offline
Давно и успешно пользуюсь для перекодировки. Спасал меня много раз:
http://www.artlebedev.ru/tools/decoder/



 
mhornДата: Воскресенье, 05.09.2010, 10:54 | Сообщение # 14
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
Quote (catty)
Давно и успешно пользуюсь для перекодировки. Спасал меня много раз:

проверил на примере из этого поста, т.е. на "é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae" - результат равен 0


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
cattyДата: Суббота, 23.10.2010, 18:38 | Сообщение # 15
Группа: Проверенные
Сообщений: 78
Репутация: 0
Статус: Offline
Quote (mhorn)
проверил на примере из этого поста, т.е. на "é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae" - результат равен 0

Да, точно. Сервис немного не для этого.)) Не подумала.
А можно ещё разик подопытный файлик, а то ссылка из первого поста не действительна уже.
Спасибо.



 
mhornДата: Суббота, 23.10.2010, 22:35 | Сообщение # 16
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
у меня подопытного файла тоже не осталось - я его перераспознал.
но думаю, вместо него сгодится и какой-нить другой такого же плана - см. прикрепление
Прикрепления: Mitta_2008PalJo.pdf (766.0 Kb)


верхнеюрские и нижнемеловые аммониты и всё что с ними связано
 
Форум сайта JURASSIC.RU » О форуме и сайте » Общая информация, ответы и вопросы » Кто-нибудь знает, что делать с кодировкой текста? (...коллективный ум - против pdf'ов МАИК Наука/Интерпериодика)
  • Страница 1 из 1
  • 1
Поиск:

jurassic.ru © 2024