Язык программирования R/Данные

Работа с внешними данными

править

Загрузка данных (файлов)

править

x <- foreign::read.spss(имя файла) # открыть файл, сохраненный в SPSS.

После этого мы получаем колонки (variables в терминах SPSS) в векторах состоящих из имени объекта х и имени переменной файла SPSS после знака $. Например, если в файле были переменные var001 и Index, то они теперь хранятся в x$var001 и x$Index соответственно.
Демаскировка имен переменных (для прямой видимости в R) и их маскировка осуществляются командами attach() и detach().

Сохранение данных

править

Для сохранения текущей сессии вместе с данными необходимо использовать команду
q("yes")
Если же надо экспортировать только данные...

Сохранение результатов

править

Работа с Hadoop

править

Какие есть возможности по работе с MapReduce?

Преобразования данных

править

= Сортировка данных в файле

править

Объединение файлов

править

= Добавление наблюдений

править

Добавление переменных по ключу

править

Аггрегация файлов

править

Создание новых файлов с аггрегированными либо частично транспонированными ячейками

Использование SQL

править

это возможно?

Фильтрация

править

Фильтрация с удалением

править

Взвешивание наблюдений

править

ls() перечислить все активные объекты rm(obj1) удалить объект