Обзор наиболее интересных материалов по анализу данных и машинному обучению №38 (2...

Обзор наиболее интересных материалов по анализу данных и машинному обучению №38 (2 — 8 марта 2015)

364
ПОДЕЛИТЬСЯ

Представляю вашему вниманию очередной выпуск обзора более увлекательных материалов , посвященных теме анализа данных и машинного обучения.

Общее

 Как говорить на языке «Data Science»
Механизированная подделка почерка для рекламщиков и соц инженеров   Бонд. Джеймс Бонд.
  Седьмая ежегодная Летняя школа Microsoft Research по машинному обучению и интеллекту — сотрудничество с ACM Europe
  Google желает измерять значимость веб-сайтов по фактам, а не ссылкам
  Wargaming и «Яндекс» сотрудничают в области Big Data
  Кто собирается заработать на будущем буме систем искусственного интеллекта?
  EBay выпустила инструмент с открытым программным кодом Pulsar для укрощения огромных данных
  Лицензирование доступа к Big Data как средство монетизации Twitter
  Почему Apache Spark меняет Кремниевую равнину
 Как стать спецом в области машинного обучения — несколько нужных советов новеньким в области машинного обучения от создателя блога MachineLearningMastery, которые посодействуют тем кто желает выстроить карьеру в данной области, но не знает с чего же начать.
 8 обстоятельств популярности Apache Spark
 Три технологии, которые изменят веб — несколько слов о популряных на данный момент разработках, основанных на использовании машинного обучения: определение речи, поиск изображений и анализ видео.
 Как PayPal употребляет Deep Learning для борьбы с мошенничеством
 IBM приобретает Deep Learning стартап AlchemyAPI
 Три главных шага для построения предсказательных приложений на базе машинного обучения
 Библиотека spragunr: Реализация метода Deep Q-learning на базе библиотеки Theano

Теория и методы машинного обучения, примеры кода

   Поиск текстов, не соответственных теме и нахождение схожих статей
  Social Network Analysis: Spark GraphX
  Создание карты музыкальных композиций — увлекательный пример зрительной классификации музыкальных композиций с помощью машинного обучения и использования языка программирования Python.
   Факторный анализ
  R: Построение графиков с помощью интегрированной функциональности визуализации — при упоминании темы визуализации с помощью языка программирования R нередко молвят о библиотеке ggplot, но не стоит забывать о интегрированных способностях визуализации Base R Plots.
Измерение эффективности модели (Часть 1) — обсуждение непременно принципиальной темы измерения эффективности работы вашей предсказательной модели.    Ловушки машинного обучения.
 Тренировка модели способом градиентного спуска с внедрением C#
 Обработка естественного языка с помощью глубинных нейронных сетей и библиотеки Torch
  Интерактивные визуализации с помощью D3.js, DC.js, Python и MongoDB
 Пример расчета PageRank с помощью Apache Hadoop

Онлайн-курсы, обучающие материалы и литература

  Онлайн-курс от Stanford University: Deep Learning for Natural Language Processing
  Онлайн-курс от MIT на edX: Introduction to Computational Thinking and Data Science
  Онлайн-курс от MIT на edX: The Analytics Edge
  Онлайн-курс на Coursera: Data Analysis and Statistical Inference
  Обзор книжек «Time Series Databases» и «New look at Anomaly detection»
  Бесплатная онлайн-книжка: Kalman and Bayesian Filters in Python
  Обзор бесплатной книжки: The Data Analytics Handbook: Big Data Edition

Видеоматериалы, подкасты

  Внедрение Deep Learning в компании Flickr
  Partially Derivative: Эпизод 16: Algorithm Aversion

Data engineering

 Внедрение Apache Storm для аналитики в настоящем времени
 Внедрение MongoDb с Hadoop и Spark: Часть 2 — пример работы с Hive
 Внедрение MongoDb с Hadoop и Spark: Часть 3 — пример работы со Spark и главные выводы

Обзоры

  Увлекательное из мира R (2-8 марта 2015 г.)
 Фаворитные материалы за недельку от KDnuggets.com (22-28 февраля)
 Фаворитные материалы за февраль от KDnuggets.com
 Еженедельный дайджест от DataScienceCentral (9 марта)
 Анонсы Data Science от MyDataMine.com (8 марта)
 Анонсы Big Data от MyDataMine.com (8 марта)
 Фаворитные ресурсы за недельку от Data Elixir (№25)
 Еженедельный сборник наилучших материалов от R1Soft (6 марта)
  Этот месяц в экосистеме Hadoop (февраль 2015)
  Анонсы экосистемы Hadoop от MyDataMine.com (3 марта)
 Более достойные внимания материалы по High Scalability (6 марта)

Предшествующий выпуск: Обзор более увлекательных материалов по анализу данных и машинному обучению №37 (23 февраля — 1 марта 2015) habrahabr.ru