Read only on LitRes

The book cannot be downloaded as a file, but can be read in our app or online on the website.

Reviews of the book «Сбор данных в Интернете на языке R», 5 reviews

Книга в концентрированном виде информация об извлечении данных преимущественно из сети Internet по средствам языка R. В самом начале книги идет отсылка к BI (Business Intelligence) не как значению «бизнес-анализ» в широком смысле слова, а к значению «бизнес-разведка». Значение слова «разведка» (Intelligence) следует рассматривать не столько как слежение за конкурентами, сколько как отслеживание собственных внутренних бизнес-процессов организации. Автор справедливо замечает, что сбор данных это основа для «data mining» в общем смысле данного определения.


Отличием книги является наличие в каждой главе списка литературы, откуда можно узнать более детальную информацию по темам главы.

Данную книгу не стоит считать «полным» руководством по сбору данных в интернете. Она скорее как базовый справочник по технологиям сбора с помощью R, поскольку в книге даны простые примеры по каждому пакету, чуть более сложные или спецефичные ситуации всё равно придётся гуглить на иностранных ресурсах, некоторые аспекты выгрузки вообще пропущенны, напр управление куками и их сохранение. Книга лишь позволит быстро сориентировать какой пакет стоит использовать.

Кстати из 280 стр только 180 относятся к сбору данных, первые 100 стр это рассказывание про синтаксис R, не очень понятно зачем они нужны, т.к человек интересующийся выгрузкой из сети с помощью R по определению уже знает синтаксис, раз задаётся такими прикладными вопросами. Эти 180 стр можно вдумчиво прочитать за 2 вечера.


В общем поставлю 4 из 5 и то из-за того что на русском и даёт быстрое представление о способах выгрузки, без гугления на иностранных ресурсах. Но объективно, по содержанию, это скорее 3 за 180 стр, особенно если по цене бумажного варианта(900 р)

Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.


Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.


Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.


Только для опытных пользователей R, которым надо работать с сайтами.


Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что

Не вполне согласен с Raniod’ом. Некоторые книги интересно читать, не зная основ. Язык R не изучают на каждом углу. Отсюда, книга – на крепкую четверку. Прочитаю – поставлю выше. Все, что относится к BI, нужно брать при реальном количестве полезной информации более 10% (выше ошибки опыта).

Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!

Log in, to rate the book and leave a review
Age restriction:
0+
Release date on Litres:
07 March 2017
Writing date:
2017
Volume:
282 p.
ISBN:
978-5-97060-459-5
Total size:
5.3 МБ
Total number of pages:
282
Copyright holder:
ДМК Пресс
Text PDF
Average rating 3,5 based on 14 ratings