X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость ( Вход | Регистрация )

Открыть тему
Тема закрыта
> Вырезание из PDF, Ищу программу
Rabineta
Rabineta
Topic Starter сообщение 3.2.2011, 12:31; Ответить: Rabineta
Сообщение #1


Участник
***

Группа: User
Сообщений: 209
Регистрация: 5.2.2010
Из: Питер
Поблагодарили: 68 раз
Репутация:   25  


Вот задался целью найти программу, которая бы качественно вырезала текст из PDF. У меня есть огромное количество PDF файлов с различным контентом, который нигде не публиковался(уникальность - 100% )
Но вот проблема, если вырезать текст из сверстанной газеты с фотографиями, которые этот текст обтекает, получается примерно такая фигня:
Благодаря
этому по
резуль
татам
иссле
дова
ний
ученые
смогут со
здать вирту
альные моде
ли исследо
ванных кре
постей. И на
основе их в ско
ром времени мо
жет появиться
виртуальный му
зей, в котором будет
представлена каждая
из исследуемых эпох


Есть ли программа, которая автоматически удаляет пробелы, переносы и мусор, чтобы текст получался абсолютно читабельным?
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
SlimSavernake
SlimSavernake
сообщение 3.2.2011, 12:51; Ответить: SlimSavernake
Сообщение #2


Участник
***


Группа: User
Сообщений: 101
Регистрация: 1.7.2010
Поблагодарили: 44 раза
Репутация:   6  


finereader


--------------------
деньги
--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
karlito
karlito
сообщение 3.2.2011, 14:20; Ответить: karlito
Сообщение #3


Участник
***

Группа: User
Сообщений: 190
Регистрация: 14.8.2008
Поблагодарили: 14 раз
Репутация:   2  


Rabineta, нет такой программы в природе. а если и есть, то она явно не в паблике... как уже сказал SlimSavernake финреадер лучший вариант.


--------------------
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Vicv08
Vicv08
сообщение 3.2.2011, 14:37; Ответить: Vicv08
Сообщение #4


Частый гость
**

Группа: User
Сообщений: 79
Регистрация: 6.7.2010
Из: Ростов-на-Дону
Поблагодарили: 17 раз
Репутация:   2  


(Rabineta @ 3.2.2011, 11:31) *
программу, которая бы качественно вырезала текст из PDF

(Rabineta @ 3.2.2011, 11:31) *
вырезать текст из сверстанной газеты

Пользуюсь материалом из сверстанной газеты, иногда представляют из редакции в формате PDF.
Вырезается элементарно программой Adobe Reader 9 (Версия 9.0.0) - у меня установлена такая (в редакции и дали).
Правой кнопкой мыши - выделить и скопировать, вставить в документ ВОРД - все.

Выделяется только текст, а изображение нет. Изображение выделяется левой кнопкой.

Сообщение отредактировал Vicv08 - 3.2.2011, 14:48
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
isay777
isay777
сообщение 3.2.2011, 14:45; Ответить: isay777
Сообщение #5


Новичок
*

Группа: User
Сообщений: 24
Регистрация: 24.1.2011
Поблагодарили: 6 раз
Репутация:   0  


PDF transformer иногда помогает хорошо
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Rabineta
Rabineta
Topic Starter сообщение 3.2.2011, 14:54; Ответить: Rabineta
Сообщение #6


Участник
***

Группа: User
Сообщений: 209
Регистрация: 5.2.2010
Из: Питер
Поблагодарили: 68 раз
Репутация:   25  


(Vicv08 @ 3.2.2011, 13:37) *
Пользуюсь материалом из сверстанной газеты, иногда представляют из редакции в формате PDF.
Вырезается элементарно программой Adobe Reader 9 (Версия 9.0.0) - у меня установлена такая (в редакции и дали).
Правой кнопкой мыши - выделить и скопировать, вставить в документ ВОРД - все.

К сожалению, этот способ не помогает... Все равно получается с переносами...

Попробую finereader и PDF transforme, может получится)

Сообщение отредактировал Rabineta - 3.2.2011, 14:57
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Vicv08
Vicv08
сообщение 3.2.2011, 15:29; Ответить: Vicv08
Сообщение #7


Частый гость
**

Группа: User
Сообщений: 79
Регистрация: 6.7.2010
Из: Ростов-на-Дону
Поблагодарили: 17 раз
Репутация:   2  


Газетчики на профессиональном уровне пользуются пакетом Adobe Acrobat 9 Pro, куда и входит Адобе Реадер, для работой с форматом PDF. А значит ничего лучше не получится найти и те маленькие неудобства, по удалению пробелов вручную, с лихвой окупятся наличием больщого количества уникального материала.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Google тестирует ярлыки PDF-файлов в результатах поиска
2 MissContent 540 11.11.2017, 13:10
автор: thunderman
Открытая тема (нет новых ответов) Купить PDF книгу с books .ru
нужен постоянный покупатель.
0 TRADEm 1008 23.9.2011, 13:45
автор: TRADEm


 



RSS Текстовая версия Сейчас: 11.12.2017, 15:32
Дизайн