Генератор случайного url с использованием bit.ly API

Всё большую популярность набирает Twitter, для использования которого нужно умение уложить мысль в 140 символов, включая в них ссылку на пост в блоге, фотографию, новостной сайт или прочее. Для этого, как известно, используются сайты-сокращатели ссылок, вроде j.mp или tinyurl.com. В результате их использования ссылка сокращается, но теряет смысл: невозможно определить, куда мы попадем: на хабрахабр или на порносайт, потому что адрес представляет собой набор из 6 символов. Более того, ссылка может вести на какую-либо опасную страницу. Наиболее часто используемый сокращатель, bit.ly (он же j.mp), решает эту проблему, проверяя ссылки: на многие сайты он не пускает, выдавая предупреждение об опасности.

Другой метод (используемый, к примеру, в расширении ChromedBird) заключается в том, что приложение делает запрос к API ссылкосжимателя, отображая пользователю уже полный url. Вышеупомянутый bit.ly такое API предоставляет, позволяя с его помощью как сжимать адреса, так и разжимать, если заданный короткий адрес (грубо говоря, хэш) существует.

Наличие подобного сервиса, позволяющего определить по хэшу ссылку, позволяет написать скрипт, выкидывающий пользователя на случайную страничку, потому что 6-значных хэшей не так уж много по сравнению с количеством возможных адресов вообще. Подобный простейший JavaScript, упакованный в плагин для Google Chrome дает удобную реализацию этого алгоритма, выдавая правильную ссылку максимум с 20 попытки.

Безусловно, перед публикацией я погуглил по запросу «Random Web Site», «Random Web Link», но все найденные результаты были основаны на выборке из базы данных, находящейся на сайте. Это не очень удобно, потому что а) эта база не очень большая, б) хранятся в ней в основном ссылки на сайты, а не на отдельные страницы. Алгоритмы, использующие поисковые системы для выдачи случайной страницы, неудобны тем, что в большинстве случаев будут выдавать либо служебные страницы, либо никому не интересные. Использование ссылок из твиттера эти проблемы разрешает.

Беглый анализ выдаваемых результатов дает список сайтов, о которых чаще всего «чирикают». В основном это новостные сайты, фотографии, страницы в соцсетях и сервисах вроде fun140.com и formspring.me. Порносайты встречаются чрезвычайно редко по понятной причине: в твиттере о них мало кто рассказывает. Зато часто попадается сайт 3gp.fm, японский музыкальный сайт, да и вообще японские сайты составляют заметную долю из всех выдаваемых, чего не скажешь о российских. Необходимо отметить, что API предоставляет возможность посмотреть популярность хэш-ссылки, тем самым фильтруя те хэш-ссылки, которые были сгенерированы для бытовых целей, вроде демонстрации другу фотографий.


0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.