Кто-нибудь знает, что делать с кодировкой текста?
|
|
AlexIpp | Дата: Пятница, 16.01.2009, 01:44 | Сообщение # 1 |
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
| Всем желающим - чисто техническая задачка Quote (mhorn) UPD. Меня совершенно изумляет то, в каком формате МАИК Наука/Интерпериодика распространяет пдфы авторам (и в каком, подозреваю, их и продаёт). Дело в том, что если попытаться скопировать из такого офиц. пдфа русский текст, вылезает абракадабра. Примерно такая: é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae. Что "переводится" так: Обосновывается самостоятельность рода и его отнесение к семейству Cardioceratidae. Это значит, что пдф по большому счёту годен только для того, чтобы с него сделать распечатку (причем для этого нужно в настройках печати отметить, чтобы пдф печатался как картинка (где и как это делать - знают далеко не все) - а то и на печати такая же хрень может появиться - смотря как принтер настроен). А работать с ним как с полноценной электронной статьёй невозможно в принципе! И статью надо заново прогонять через файнридер!!!! Есть идеи? Что сделать с файлами (помимо предложенного перераспознания), чтобы с их текстовым содержимым можно было полноценно работать? Подопытный файл: http://file.qip.ru/file....1_.html Сообщения #2-4 перенесены из темы http://jurassic.ucoz.ru/forum/8-451-1
всё о серпулидах & белемнитах
|
|
| |
AlexIpp | Дата: Пятница, 16.01.2009, 01:44 | Сообщение # 2 |
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
| Quote (mhorn) Меня совершенно изумляет то, в каком формате МАИК Наука/Интерпериодика распространяет пдфы авторам (и в каком, подозреваю, их и продаёт). Дело в том, что если попытаться скопировать из такого офиц. пдфа русский текст, вылезает абракадабра. Примерно такая: é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae. Что "переводится" так: Обосновывается самостоятельность рода и его отнесение к семейству Cardioceratidae. Ты знаешь, я думал, здесь проблемы со шрифтами, ан нет. Это какая-то хитрая кодировка по умолчанию у них стоит. Частично текст удалось восстановить с помощью Штирлица PS. Но даже сам Штирлиц (!) не смог полностью эту абракадабру переварить
всё о серпулидах & белемнитах
|
|
| |
Юстас | Дата: Пятница, 16.01.2009, 01:44 | Сообщение # 3 |
Группа: Проверенные
Сообщений: 14
Репутация: 0
Статус: Offline
| Quote (mhorn) UPD. И ещё. Меня совершенно изумляет то, в каком формате МАИК Наука/Интерпериодика распространяет пдфы авторам (и в каком, подозреваю, их и продаёт). Дело в том, что если попытаться скопировать из такого офиц. пдфа русский текст, вылезает абракадабра. Примерно такая: é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae. Что "переводится" так: Обосновывается самостоятельность рода и его отнесение к семейству Cardioceratidae. Это значит, что пдф по большому счёту годен только для того, чтобы с него сделать распечатку (причем для этого нужно в настройках печати отметить, чтобы пдф печатался как картинка (где и как это делать - знают далеко не все) - а то и на печати такая же хрень может появиться - смотря как принтер настроен). А работать с ним как с полноценной электронной статьёй невозможно в принципе! И статью надо заново прогонять через файнридер!!!! У меня почему-то никаких проблем с копированием текста. (Акробат 8.0 Pro, Foxit 2.3) Полагаю, дело не в пдф'е.
|
|
| |
AlexIpp | Дата: Пятница, 16.01.2009, 01:45 | Сообщение # 4 |
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
| Quote (Юстас) У меня почему-то никаких проблем с копированием текста. (Акробат 8.0 Pro, Foxit 2.3) Полагаю, дело не в пдф'е. Юстас, дело в том, что в старой теме (см. выше) mhorn выложил уже перераспознанную FineReader'ом статью. А тот файл, по поводу которого он возмущался - в первом сообщении данной темы
всё о серпулидах & белемнитах
|
|
| |
Ecolog | Дата: Пятница, 16.01.2009, 19:00 | Сообщение # 5 |
Группа: Проверенные
Сообщений: 123
Репутация: 0
Статус: Offline
| Мне кроме вариантов 1. распознать Файнридером или 2. раздобыть где-то эти редкие шрифты ничего в голову не приходит
Любитель аммонитов и прочих головоножек
|
|
| |
mhorn | Дата: Пятница, 16.01.2009, 20:18 | Сообщение # 6 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Quote (Ecolog) 2. раздобыть где-то эти редкие шрифты это шрифт Times-Pandre-Light удивительно, но поиск гуглем привел лишь на форум тех, которые тоже имеют с этим шрифтом проблемы загадка: почему используется такой извращенный шрифт?
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
AlexIpp | Дата: Пятница, 16.01.2009, 21:06 | Сообщение # 7 |
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
| Quote (mhorn) это шрифт Times-Pandre-Light удивительно, но поиск гуглем привел лишь на форум тех, которые тоже имеют с этим шрифтом проблемы загадка: почему используется такой извращенный шрифт? Не понял, причем тут шрифт. Вот я делаю водяные знаки шрифтом OldredFull No.7, которого у тебя нет в 7 Акробате - и что, ты их не видишь??? Вроде нет проблем... И если бы дело было в шрифте, то почему тогда программа для смены кодировки частично восстановила текст? К тому же, насколько я знаю, вместо неизвестных шрифтов печатается не абра, а белые прямоугольнички. Всегда По поводу шрифта самый простой способ - спросить в редакции, какой прогой они пользуются, набор шрифтов ведь у каждой свой
всё о серпулидах & белемнитах
|
|
| |
mhorn | Дата: Пятница, 16.01.2009, 21:55 | Сообщение # 8 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Quote (AlexIpp) Не понял, причем тут шрифт. Вот я делаю водяные знаки шрифтом OldredFull No.7, которого у тебя нет в 7 Акробате - и что, ты их не видишь??? Вроде нет проблем... это потому что надпись-то - латиницей. Вон, в этой абракадабре Cardioceratidae нормально написались Quote (AlexIpp) К тому же, насколько я знаю, вместо неизвестных шрифтов печатается не абра, а белые прямоугольнички. Всегда это в ворде, там .ttf-шные шрифты, а этот - наверняка ещё какой-нибудь Quote (AlexIpp) По поводу шрифта самый простой способ - спросить в редакции, какой прогой они пользуются, набор шрифтов ведь у каждой свой в редакции раньше пользовались печатной машинкой теперь - вордом а вот в издательство МАИК Наука/Интерпериодика я письмецо накатаю обязательно
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
AlexIpp | Дата: Пятница, 16.01.2009, 22:12 | Сообщение # 9 |
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
| Quote (mhorn) это потому что надпись-то - латиницей. Вон, в этой абракадабре Cardioceratidae нормально написались во, именно поэтому-то дело не в шрифте (иначе бы все символы НЕ читались!), а в типе кодировки русскоязычных символов
всё о серпулидах & белемнитах
|
|
| |
Ecolog | Дата: Четверг, 22.01.2009, 23:54 | Сообщение # 10 |
Группа: Проверенные
Сообщений: 123
Репутация: 0
Статус: Offline
| Quote Не понял, причем тут шрифт. Вот я делаю водяные знаки шрифтом OldredFull No.7, которого у тебя нет в 7 Акробате - и что, ты их не видишь??? Вроде нет проблем... Дело точно в шрифтах - ведь акробатовские файлы хранят шрифты в себе (от настроек зависит, но тут именно так) и в принципе этого удивительного шрифта может не быть нигде, кроме как у автора файла, но файл будет везде читаться. Читаться, но не копироваться. Так что надо либо искать шрифт, либо его как-то выдрать из файла, но я таких методов не знаю, а гугленье адекватных программок не принесло.
Любитель аммонитов и прочих головоножек
|
|
| |
AlexIpp | Дата: Пятница, 23.01.2009, 00:19 | Сообщение # 11 |
Группа: Администраторы
Сообщений: 579
Репутация: 0
Статус: Offline
| Quote (Ecolog) Дело точно в шрифтах - ведь акробатовские файлы хранят шрифты в себе (от настроек зависит, но тут именно так) и в принципе этого удивительного шрифта может не быть нигде, кроме как у автора файла ... только почему тогда англоязычные символы читаются, в отличие от русскоязычных??
всё о серпулидах & белемнитах
|
|
| |
mhorn | Дата: Воскресенье, 20.06.2010, 09:30 | Сообщение # 12 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| то ли в МАИК Наука/Интерпериодика заходят на наш форум, то ли им многие про кривые шрифты написали - так или иначе, в публикациях этого года всё ОК, и кириллица запросто копируется
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
catty | Дата: Четверг, 01.07.2010, 16:23 | Сообщение # 13 |
Группа: Проверенные
Сообщений: 78
Репутация: 0
Статус: Offline
| Давно и успешно пользуюсь для перекодировки. Спасал меня много раз: http://www.artlebedev.ru/tools/decoder/
|
|
| |
mhorn | Дата: Воскресенье, 05.09.2010, 10:54 | Сообщение # 14 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| Quote (catty) Давно и успешно пользуюсь для перекодировки. Спасал меня много раз: проверил на примере из этого поста, т.е. на "é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae" - результат равен 0
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
catty | Дата: Суббота, 23.10.2010, 18:38 | Сообщение # 15 |
Группа: Проверенные
Сообщений: 78
Репутация: 0
Статус: Offline
| Quote (mhorn) проверил на примере из этого поста, т.е. на "é·ÓÒÌÓ‚˚‚‡ÂÚÒfl Ò‡ÏÓÒÚÓflÚÂθÌÓÒÚ¸ Ó‰‡ Ë Â„Ó ÓÚÌÂÒÂÌËÂ Í ÒÂÏÂÈÒÚ‚Û Cardioceratidae" - результат равен 0 Да, точно. Сервис немного не для этого.)) Не подумала. А можно ещё разик подопытный файлик, а то ссылка из первого поста не действительна уже. Спасибо.
|
|
| |
mhorn | Дата: Суббота, 23.10.2010, 22:35 | Сообщение # 16 |
Admin
Группа: Администраторы
Сообщений: 3615
Репутация: 0
Статус: Offline
| у меня подопытного файла тоже не осталось - я его перераспознал. но думаю, вместо него сгодится и какой-нить другой такого же плана - см. прикрепление
верхнеюрские и нижнемеловые аммониты и всё что с ними связано
|
|
| |
|