Основные понятия
Перед тем как на примере посмотреть основные принципы работы с RapidMiner сделаем небольшое введение в его основные понятия.
Skoda rapid — самый долгожданный «бюджетник» — свободная пресса
Появление этого автомобиля существенно повлияет на рынок недорогих иномарок, ведь при умеренной цене Rapid предлагает весьма неплохой уровень технологий и конструкторской проработки. И это не считая типичной для «Шкод» практичности.
Коль скоро Rapid продается в Европе уже больше года (в этом смысле он и впрямь долгожданный), у нас есть возможность проанализировать отзывы журналистов и первых владельцев. Российская премьера состоится в течение 2020 года.
Что такое Rapid?
Skoda Rapid стоит на полступеньки ниже Skoda Octavia и построен на платформе, унифицированной с Volkswagen Polo Sedan: передняя часть «тележки» заимствована от Fabia, а задняя — от Octavia первого поколения (с полузависимой подвеской). Но Rapid крупнее «Полика» и имеет кузов «лифтбэк». Благодаря этому он отличается одним из самых больших и удобных в классе багажников — 550 л. Есть и альтернативный тип кузова Spaceback — нечто среднее, между универсалом и хетчем. На виде спереди Rapid очень напоминает Octavia, хотя в профиль более «нахохлен».
В Европе автомобиль предлагается с несколькими моторами: 1.2 (75 л.с.), 1.2 TSI (86 л.с. и 105 л.с.), 1.4 TSI (122 л.с.), 1.6 TDI (90 л.с. и 105 л.с.). Скорее всего, для России линейка будет своя, и начальные версии пойдут с мотором 1.6 (105 л.с.), которым оснащается Polo Sedan.
Понравился ли Rapid европейцам?
В целом — да. В Европе первоочередным критерием является value for money (то, что мы называем цена/качество), и Skoda Rapid создавалась как раз под этот критерий.
Многие оценили невероятный простор на втором ряду (длина колесной базы — 2,6 метра), и феноменальный багажник объемом 550 литров, достоинства которого дополняет кузов типа лифт-бэк. Правда, «Рапид» критикуют за высокий уровень порога и невозможность сложить сиденья в ровный пол. Кроме того, салон узковат, ведь автомобиль частично построен на платформе В-класса.
В отделке салона сквозит экономия на материалах — пластик жесткий, дизайн — незатейливый, в черном цвете салон выглядит мрачновато. Однако подгонка панелей хорошая, а сама стилистика выдержана в едином ключе, поэтому ощущения «дешманского» интерьера нет.
Наддувные двигатели, включая 1.2 TSI, обеспечивают «Рапиду» отличную динамику — вероятно, по этому параметру турбо-Рапид был бы в России лидером класса. К сожалению, нет данных о динамике с мотором 1,6 л, но можно предположить, что более грузный «Рапид» уступит Polo Sedan, а тот, в свою очередь, сам по себе не слишком шустр. Поэтому, вероятно, для «Рапида» предложат турбомоторы и в российских версиях.
«Фольксвагеновская» пятиступенчатая «механика» традиционно вызывает у европейцев восторги, а «автомат» для России, скорее всего, будет тем же, что для Polo Sedan — шестиступенчатым, гидромеханическим. Впрочем, если «Шкода» решится поставлять TSI моторы, можно будет заказать машину с преселективным роботом DSG.
Rapid получил высокие оценки журналистов и пользователей за управляемость и незначительные крены в поворотах, при этом многим машина показалась излишне жесткой.
«Обратная сторона — скорее жесткое шасси, — пишет Хилтон Холловэй из журнала Autocar. — Конечно, водитель может заставить машину легко струится через повороты на умеренных скоростях, но через серийные неровности на дороге с бетонным покрытием „Рапид“ переваливается весьма жестко. На сельских дорогах с выбоинами он простукивает о качестве поверхности слишком дотошно, а подвеска передает в салоне много шумов».
Впрочем, настройка подвески для России может быть совершенно иной, поэтому, не исключено, что наши Rapid будут чуть менее спортивными, но более комфортными.
Кстати, в Индии с прошлого года производится Skoda Rapid, но это совершенно иная модель, практически полностью копирующая наш Polo Sedan, но с «лицом» от Fabia. Европейский Rapid — это разработка с чистого листа: он более крупный и вместительный, хотя механическая начинка у них во многом идентична.
Сколько будет стоить Rapid?
Официальных данных пока нет, но кое-какие предположения сделать можно. В Европе Skoda Rapid дешевле старшей сестры «Октавии» примерно на треть, поэтому в России Rapid 1.6 с кондиционером должен стоить в районе 550 тысяч рублей. Возможно, пустую «базу» сделают более дешевой, но основной спрос должен придтись на версии ценой 550−600 тысяч рублей.
Примерно такую же ценовую вилку получаем, анализируя субординацию моделей Skoda в России: так, Fabia 1.6 стоит от 519 тысяч, а Octavia — от 589 тысяч, тогда как базовый Rapid должен попадать между ними.
Контекст процесса
Контексту соответствует вкладка Context где мы можем увидеть три секции:
- Process input — данные передающиеся на вход процесса. Тут можно указать путь к данными внутри репозитория.
- Process output — тут указывается путь в репозитории, куда будет сохранен результат работы процесса.
- Macros — это глобальная переменная доступная в процессе из любого места. Может принимать в качестве значения только строки или числа.
Отметим, что
Process inputProcess output
обозначены в процессе кружками по границе процесса с надписями
inpres
. Чтобы воспользоваться данными из входа или сохранить их нужно соединить соответствующий кружок с входом/выходом операторов.
Самое лучшее обучение — практика. Сделаем небольшой процесс на основе которого увидим основные принципы работы с майнером.
Вы директор небольшой компании, которая занимается созданием сайтов, промышленным дизайном и т.д. Достаточно часто, ввиду большого количества заказов и недостатка сотрудников вы нанимаете фрилансеров из разных стран (т.к. клиенты со всего мира) и исправно вносите информацию о выполненных работах в эксель табличку указывая имя исполнителя, род работы, дату оплаты, сумму и валюту оплаты. В какой то момент вам захотелось получить сумму затрат, в рублях (на курс ЦБ), которую вы понесли в разбивке по видам работ на конкретную дату (более интересные случаи — разбивка по месяцам, сотрудникам остаются на собственные эксперименты).
Оператор
Логическая единица процесса. Оператор производит какие то действия над данными, у него есть вход-выход (так называемые «порты»), на вход приходят данные, на выход идут обработанные оператором данные. Таким образом мы можем делать цепочки обработки данных, к примеру — считать транзакции клиентов из БД, найти самые большие, сконвертировать в доллары и выдать результат.
В интерфейсе программы операторам соответствует вкладка Operators — где в иерархии они сгруппированы по функциональному признаку. Чтобы воспользоваться оператором необходимо нажать на него и перенести в рабочую область процесса.
Процесс
Совокупность операторов соединенных между собой в заданном порядке для выполнения требуемой задачи анализа/обработки данных.
Репозиторий
Место для хранения процессов RM. Может быть локальным, а также удаленным (RapidMiner Server), для которого возможно исполнять процессы на стороне сервера, многопользовательский доступ к процессам/соединениям БД, запуск процессов по расписанию или отдача данных как веб-сервис.
Во вкладе Repositories в RM тут можно увидеть только Samples, DB и Local Repository. Первое как уже понятно из название набор процессов — примеров, DB — текущие соединения к базам данных доступных в майнере (определяются через Tools -> Manage Database Connections) и Local Repository, место для хранения собственных процессов на компьютере.
Установка
Не так давно c официального сайта ссылки на скачивание RapidMiner 5 были удалены, поэтому соберем RM из исходного кода который возьмем в
на гитхабе.
Для сборки RapidMiner’a из репозитория нам понадобится
Зайдем в консоль, перейдем в каталог куда хотели бы поставить майнер, клонируем репозиторий