Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub




В недрах популярных социальных сетей - Twitter, Facebook, LinkedIn и Instagram* - скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker. Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram*), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере Twitter. Прочитайте эту книгу, чтобы - Узнать о современном ландшафте социальных сетей - Научиться использовать Docker, чтобы легко оперировать кодами, приведенными в книге; - Узнать, как адаптировать и поставлять код в открытый репозиторий GitHub; - Научиться анализировать собираемые данные с использованием возможностей Python 3; - Освоить продвинутые приемы анализа, такие как TFIDF, косинусное сходство, анализ словосочетаний, определение клика и распознавание образов; - Узнать, как создавать красивые визуализации данных с помощью Python и JavaScript. Мэтью Рассел (Matthew Russell) - директор Built Technologies, он возглавляет команду лидеров, работающую над улучшением нашего мира. Вне работы Мэтью рациональный индивидуалист, готовящийся к возможному зомби-апокалипсису. Михаил Классен (Mikhail Klassen) - главный специалист по обработке и анализу данных в Paladin AI, стартапе, занимающемуся адаптивными технологиями обучения. Он увлекается проблемами искусственного интеллекта и анализом данных. Когда Михаил не занят на работе, он любит читать и путешествовать. *соцсеть принадлежит компании Meta, признанной экстремистской в РФ
Перейти к описанию и характеристикамИздательство | Питер |
Серия | Бестселлеры O`Reilly |
Вес, г | 639 |
В недрах популярных социальных сетей - Twitter, Facebook, LinkedIn и Instagram* - скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker. Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram*), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере ...
Издательство | Питер |
Серия | Бестселлеры O`Reilly |
Вес, г | 639 |