Книга в концентрированном виде информация об извлечении данных преимущественно из сети Internet по средствам языка R. В самом начале книги идет отсылка к BI (Business Intelligence) не как значению «бизнес-анализ» в широком смысле слова, а к значению «бизнес-разведка». Значение слова «разведка» (Intelligence) следует рассматривать не столько как слежение за конкурентами, сколько как отслеживание собственных внутренних бизнес-процессов организации. Автор справедливо замечает, что сбор данных это основа для «data mining» в общем смысле данного определения.
Данную книгу не стоит считать «полным» руководством по сбору данных в интернете. Она скорее как базовый справочник по технологиям сбора с помощью R, поскольку в книге даны простые примеры по каждому пакету, чуть более сложные или спецефичные ситуации всё равно придётся гуглить на иностранных ресурсах, некоторые аспекты выгрузки вообще пропущенны, напр управление куками и их сохранение. Книга лишь позволит быстро сориентировать какой пакет стоит использовать.
Кстати из 280 стр только 180 относятся к сбору данных, первые 100 стр это рассказывание про синтаксис R, не очень понятно зачем они нужны, т.к человек интересующийся выгрузкой из сети с помощью R по определению уже знает синтаксис, раз задаётся такими... Next
Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
Не вполне согласен с Raniod’ом. Некоторые книги интересно читать, не зная основ. Язык R не изучают на каждом углу. Отсюда, книга – на крепкую четверку. Прочитаю – поставлю выше. Все, что относится к BI, нужно брать при реальном количестве полезной информации более 10% (выше ошибки опыта).
Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!
Reviews of the book «Сбор данных в Интернете на языке R», 5 reviews