Храните вашу информацию в формате PDF

Подготавливая дипломную или курсовую работу, диссертацию или просто доклад, мы ищем и изучаем информацию по нужной тематике. Сегодня, когда у каждого есть доступ в Интернет, сделать это достаточно просто. В ходе поисков, мы сохраняем заинтересовавшие нас страницы в форматах HTML, MTH и в виде обычного текста, скачиваем документы Word, Writer, Power Point и т.д. и т.п. Как правило, мы сохраняем ещё и кучу графической информации в самых разнообразных форматах. При этом, я уверен, мало кто задумывается над тем, в скольких именно форматах сохраняется информация. Но вот настаёт день, когда нам требуется отыскать среди всего этого добра что-то нужное. И мы начинаем просматривать массив информации, используя при этом десяток программ. Думается, у многих в этой ситуации мелькает мысль: вот бы всё это было в одном файле, да ещё и с исходным форматированием документов, и с поиском, и... А ведь такое вполне возможно!

Итак, наша задача — представить всю информацию в едином формате, который должен позволять работать (как минимум — обеспечивать просмотр) с информацией как в графическом, так и текстовом виде. И такой формат давно имеется и широко используется. Речь идёт о PDF (Portable Document Format, переносной формат документов), разработанном компанией Adobe с целью предоставления организациям, использующим большое количество документов, возможности сохранять точное форматирование при обмене электронными файлами. Более того, PDF изначально предназначался для просмотра на экране полностью отформатированных документов без помощи создавшего их приложения и (или) установки дополнительных шрифтов! Причём такие документы будут с одинаковым успехом читаться независимо от используемой операционной системы (Windows, MacOS или Linux). Более того, документы в формате PDF можно использовать на всевозможных гаджетах, например, в электронных книгах. Это, кстати, очень удобно в случаях, когда необходимо иметь под рукой большой объём информации в мобильном виде. Что, кстати, я с успехом и использую.
Что же, с форматом определились. Осталось только конвертировать необходимую информацию в PDF. Этим мы сейчас и займёмся. Поскольку большую часть информации мы получаем из Сети, логично начать с конвертации в PDF именно web-страниц.

Web → PDF
Один из самых удобных способов преобразования web-страниц в формат PDF — это специализированные онлайн-сервисы. Я расскажу о двух таких сервисах, наиболее, на мой взгляд, удобных.

PrintWhatYouLike
Начать работу с этим сервисом очень просто. Сначала заходим на сайт www.printwhatyoulike.com. На главной странице находим гиперссылку «Bookmarklet: Add PrintWhatYouLike to your browser» («Закладка: добавь PrintWhatYouLike в свой браузер»), после клика по которой попадаем на следующую страницу, в верхней части которой отыскиваем текст «Drag this link: PrintWhatYouLike into your bookmarks toolbar» («Перетащи эту ссылку на панель закладок браузера»). После собственно перетаскивания мы получим на панели нашего браузера кнопку «PrintWhatYouLike», которая позволяет обратиться к сервису одним щелчком мышкой.
По нажатию на эту кнопку начинается самое интересное: процесс отбора необходимого нам контента (название сервиса не даром переводится как «Печатаем то, что нам нужно»).

Сервис PrintWhatYouLike

Сервис PrintWhatYouLike

Во время отбора в левой части нашей страницы с информацией появляется боковая панель с инструментами. С их помощью можно выделить отдельные элементы web-страницы (при этом блоки помечаются жёлтым цветом), после чего применить к ним одно из доступных действий: изолировать элемент, отбросив весь остальной контент; удалить элемент со страницы; отменить последнее действие и т. д. Таким образом можно убрать со страницы всё лишнее, сохранив лишь необходимую нам информацию. Также с помощью инструментов на боковой панели вы можете изменить шрифт текстового контента (в том числе — увеличить его), и убрать границы и рисунки.
После «раскройки» страницы можно сохранить информацию в файл PDF нажатием на панели инструментов кнопки «Save As» («Сохранить как»). Кстати, сервис PrintWhatYouLike предоставляет ещё одну ценную возможность: вы можете добавлять новые страницы к уже созданной, что позволяет создавать один PDF файл, содержащий информацию с нескольких страниц или сайтов.
Иногда попытка конвертации заканчивается неудачей, о чём нам сообщает надпись «Oops, something went wrong with your request» и картинка с милой зверушкой, должная видимо, поднять нам настроение... Не знаю, станет ли вам легче при виде зверушки, но даже если PrintWhatYouLike не справился с нужной нам страницей, шанс сохранить её в PDF остаётся. Например, с помощью программы DoPDF, о которой пойдёт речь чуть ниже.

JoliPrint
Этот отличный сервис в процессе конвертации начисто «режет» рекламу, элементы навигации, вспомогательные блоки и прочие ненужные элементы web-страницы. Причём делает он это автоматически. А работает всё по уже знакомой нам схеме: идём на сайт joliprint.com, находим гиперссылку «Add joliprint to your browser», перетаскиваем её на панель закладок нашего браузера, после чего получаем возможность сохранять страницы в PDF одним щелчком по данной кнопке.

Добавляем Joliprint в закладки браузера

Добавляем Joliprint в закладки браузера

Правда и здесь есть свои «но». Во-первых, иногда попытка конвертации заканчивается неудачей. А во-вторых, даже при успешной конвертации изредка можно обнаружить в PDF-файле не совсем корректное форматирование. Особенно часто проблемы возникают при сохранении таблиц. В результате получаем малопригодные (или вовсе бесполезные) PDF.

Web2PDFConverter для Google Chrome
Я работаю с браузером Google Chrome, для которого имеется несколько расширений, решающих нашу проблемую Одно из них — Save as PDF, Web2PDFConverter. Его, как и все прочи расширения для этого браузера, можно найти в интернет-магазине Chrome, который, кстати, недавно обзавёлся русским интерфейсом. И не бойтесь слова «магазин» — подавляющее большинство расширений «продаются» в нём абсолютно бесплатно (включая упомянутые выше).
Для примера рассмотрим работу с расширением Web2PDFConverter, которое позволяет конвертировать в PDF любую web-страницу, включая большинство сайтов на основе SSL. Правда, изредка встречаются сайты, намеренно защищённые от копирования, но это скорее исключение.
После установки расширения на панели инструментов Chrome появляется кнопка «Конвертировать эту Web страницу в PDF». Далее всё просто: открываем нужную страницу, щёлкаем по кнопке и видим небольшое окно «Convert web pages to pdf», в котором нужно нажать кнопку «Convert to pdf», после чего выбрать путь для сохранения готового PDF (тут же, кстати, отображается и его размер), либо просмотреть его при помощи GoogleDocs.

Сервис Web2PDF

Сервис Web2PDF

Сохранённый документе будет точной копией нашей web-страницы, включая все рекламные блоки, элементы навигации и прочий информационный мусор. Именно поэтому я использую расширение Web2PDFConverter в последнюю очередь (только если страницу не получилось сохранить с помощью рассмотренных выше сервисов). Хотя в целом это расширение (в отличие от всё тех же сервисов) работает «безотказно»: если страница не защищена, то она точно будет конвертирована в PDF.

Документ → PDF
Из всех «документальных» форматов нас, в первую очередь, интересуют документы Microsoft Office. Начиная с версии 2007 сохранить документ в PDF можно штатными средствами — достаточно в диалоге сохранения файла выбрать формат «PDF или XPS». Качество конвертации довольно приличное.
Аналогичная возможность присутствует (причём очень давно) в офисных пакетах OpenOffice/LibreOffice. В них за сохранение в PDF отвечает отдельная кнопка на панели инструментов.
Существует, впрочем, и универсальный метод сохранения документов в PDF. Речь идёт о маленькой и бесплатной (но при этом — очень удобной и эффективной) программе DoPDF. Она позволяет преобразовывать в PDF документы из любых программ, имеющих функцию печати (включая Microsoft Word, Excel, PowerPoint, разнообразные текстовые редакторы, почтовые программы и браузеры).
После установки программы в системе появляется новый виртуальный принтер. Если отправить на этот принтер любой документ (через обычный диалог печати нужной программы), то появится окно DoPDF, в котором можно указать некоторые параметры конвертации.

Виртуальный принтер doPDF

Виртуальный принтер doPDF

Параметры сохранения в PDF

Параметры сохранения в PDF

Например, вы можете сохранять все сконвертированные файлы в одной и той же папке. Чтобы сообщить о своём желании программе, при сохранении любого документа выберите нужную папку и установите флажок «Всегда использовать эту папку». Ещё один флажок, «Открыть PDF», позволяет автоматически открывать полученный при конвертации PDF.
Обратите внимание, что DoPDF сохраняет страницы в том виде, в каком они отображаются в своих родных программах. Поэтому если вы хотите увеличить размер шрифта, делайте это до конвертации с помощью штатных средств нужной программы (например, Word).
Кстати, именно с помощью DoPDF можно сохранять web-страницы, с которыми не справились сервисы и расширения для браузеров. Достаточно отправить проблемную страницу на печать.

* * *
Итак, мы сохранили всю необходимую нам информацию в формат PDF. Следующим этапом является объединение этой информации в едином файле, но это уже тема отдельной статьи.


Рекомендуем почитать: