Мия (5.8.2006, 17:16) писал:
Я пользуюсь Adobe,но он не желает хранить текст. С рапидшарой я не разобралась как скачать ее, она платная вроде написано. Мне надо только распознающая иврит.
И что такое pdf c распознанным текстом? Мне как раз и надо программа которая этот текст распознать сумеет, чтобы с ним работать можно было. Как это я скопирую текст из pdf когда я могу только в формате картинки копировать оттуда?
Нееее... Ну так же нельзя! Мне же теперь на полночи объяснения писать!
Пойду
С рапидшарой я не разобралась как скачать ее, она платная вроде написано.
"Уж сколько раз твердили миру":
Как качать с рапидшары - раз
Как качать с рапидшары - два
Как качать с рапидшары - примерно 155
Цитата
Мне надо только распознающая иврит.
Ну нет у меня ивритского *.pdf! Как я ее протестю?
Цитата
...что такое pdf c распознанным текстом?
Файлы *.pdf могут быть получены двумя основными способами:
1. "Изготовлены" "с нуля" в какой-либо программе (текстово-графическом редакторе) и сохранены (экспортированны) в формат *.pdf - в данном варианте практически всегда тест "распознан", т.е. текст является текстом, а картинка - картинкой.
2. Получены из "твердой копии" (бумажной книги или др. документа) путем сканирования и конвертации скана (изображения, полученного сканированием) в *.pdf без или с распознанием текста. В первом варианте (без распознания) и картинка, и текст являются картинкой, изображением, полученным при сканировании. Во втором варианте между сканированием и конвертацией в *.pdf присутствует промежуточный этап распознания текста специальными программами, которые выделяют из общей картинки элементы, похожие по мнению программы на буквы, "опознают" их и превращают их из картинки в шрифт.
Цитата
Мне как раз и надо программа которая этот текст распознать сумеет, чтобы с ним работать можно было
Такая программа очень мало кому нужна - сканирование вообще, а тем более с распознанием текста - невероятно трудоемкий и времяемкий процесс. Распознание готового скана (или нераспознанного *.pdf - также требует чрезвычайно много времени и терпения.
Наиболее известная программа для распознания текста - FineReader - платная, с очень мощной защитой от взлома. Мне так и не удалось в свое время найти полноценно работающие кряки, кейгены или серийники. Все появляющиеся на варезниках взломанные копии программы или кряки, кейгены и серийники очень быстро отслеживаются и уничтожаются фирмой, защищающей интересы производителя программы. Имеющийся у меня portable-вариант распознает только английский и русский. Но это не важно - повторюсь, эта программа все равно не понадобится.
Цитата
Как это я скопирую текст из pdf когда я могу только в формате картинки копировать оттуда?
Если текст распознан - то копирование его в большинстве случаев не представляет проблемы: в ридере *.pdf курсор меняется на выделение, выделяется нужный фрагмент текста, копируется в буфер и т.д. (Если файл небольшой - до 20 стр., переключив курсор на выделение, можно выделить и скопировать сразу всё клавишами "Ctrl+A", "Ctrl+C". Если файл большой, а комп слабый - во избежание зависания лучше копировать постранично.)
pdf_select_text.jpg (31,33К)
Количество загрузок:: 7
Если текст не распознан - то его как текст выделить не удасться - будет выделяться только фрагмент изображения (картинки) текста.
pdf_select_NO_text.jpg (45,66К)
Количество загрузок:: 10
Цитата
Я пользуюсь Adobe,но он не желает хранить текст.
Это может означать, что либо текст нераспознан - т.е., как было сказано выше, он представляет из себя изображение - картинку, либо файл защищен от копирования.
Во втором случае (при защите от копирования) могут также возникнуть проблемы и с прямым копированием распознанного текста через буфер. (Также могут возникнуть проблемы при каком-либо несовпадении кодировок.)
Программы, о которых изначально был задан вопрос - это не программы распознавания текста, а конвертеры из одного формата в другой - т.е., из pdf в txt или в dоc. (Есть также конвертеры "наоборот" - из txt в pdf)