Скачиваем журнал «Компьютерра» в электронную книжку
«Компьютерра»-offline
Журнал «Компьютерра» был моим любимым компьютерным еженедельником. Прекращение существования его бумажной версии в конце 2009 года стало для меня большим разочарованием.
Оказалось, что я совершенно не приспособлен читать online-версию журнала. Во-первых, свободное время для чтения журнала у меня почти всегда находится либо в дороге, либо тогда, когда я нахожусь далеко от компьютера. Во-вторых, заходя на сайт, мне неудобно искать новые статьи среди уже прочитанных. Короче говоря, я привык покупать новый номер журнала и с удобством читать его от начала до конца.
Мне не оставалось ничего другого, как написать скрипт, выкачивающий с сайта «Компьютерры» все новые статьи и выдающий их на одной HTML-странице. Так возник проект «Компьютерра»-offline.
Скачать всю «Компьютерру»
Просто зайдите на сайт «Компьютерры» и вместо адреса www.computerra.ru в адресной строке браузера вставьте текст из файла ct_offline.js. Нажмите Enter.
Скрипт загрузит все статьи (кроме архивных), сгруппировав их по разделам. Когда Вы в следующий раз зайдете на сайт «Компьютерры» и запустите скрипт, он скачает только новые статьи, которые еще не были загружены. Если Вы хотите скачать заново все статьи, просто очистите историю посещенных страниц в браузере.
Для удобства создайте в браузере закладку, у которой вместо адреса вставлен текст скрипта. Чтобы запустить скрипт, зайдите на сайт «Компьютерры» и нажмите на эту закладку.
Совместимость. Лучше всего подойдет браузер Opera; отлично работали старые версии Chrome и Firefox, но теперь из-за идей безопасности в последних версиях этих браузеров отключена возможность проверки посещенных ссылок, и они каждый раз будут скачивать все старые статьи «Компьютерры» вместе с новыми. В Internet Explorer скрипт не будет работать, потому что в Internet Explorer длина адресной строки ограничена 2047 символами, и скрипт в ней не помещается. В некоторых браузерах не поддерживаются переносы строк в адресной строке, для таких браузеров используйте вариант скрипта ct_offline_nr.js, не содержащий переносы строк.
Полученную HTML-страницу можно сохранить или распечатать, а можно сделать из нее PDF-файл для чтения в электронной книге.
Изготовить PDF-файл
Для этого понадобится бесплатный PDFCreator (или другая программа, работающая как виртуальный принтер в формат PDF, например, Adobe Acrobat) и браузер Opera.
Просто откройте сгенерированный скриптом HTML-файл в браузере Opera, отправьте его на печать на виртуальном принтере PDFCreator и в настройках этого принтера задайте специальный размер страницы 75 мм на 100 мм, а в настройках печати Opera включите опцию «Fit to paper width».
Совместимость. Требуется браузер Opera: при печати он умеет вписывать картинки в размер страницы. Я не нашел такой возможности в других браузерах. Желательно использовать последнюю версию Opera, так как в старых версиях при печати почти всегда возникают ошибки. Если у Вашей электронной книги соотношение сторон экрана отличается от 3:4, то измените соответствующим образом размер страницы 75 мм на 100 мм. Чем больше размер страницы, тем мельче будет текст на экране электронной книги. Когда PDFCreator первый раз предложит сохранить PDF-файл, лучше сначала зайдите в настройки и в свойствах формата PDF выберите высокое качество изображений, после чего сохраните эти настройки.
Пример полученного PDF-файла можно посмотреть здесь.
Поддержка
Дизайн сайта «Компьютерры» иногда меняется, и скрипт может перестать работать. Я буду выкладывать обновленные версии скрипта на странице проекта.
0 комментариев