Отобрать определенное количество записей в листе R
У меня есть датасет baseball из библиотеки plyr. Нужно отобрать те команды, где есть 200 и больше записей и записать это в матрицу, взяв по 200 записей у каждой команды. У меня получилось только отсортировать, а как действовать дальше не понятно. Класс и тип переменной teams - list
library(plyr)
baseball
teams = split(baseball, baseball$team)
teams
Ответы (1 шт):
Автор решения: black_paladin
→ Ссылка
Посмотрите справку по функциям библиотеки plyr. match_df делает почти то что Вы хотите и даже с тем же датасетом. Отобрать команды можно так:
library(dplyr)
fdf<-ddply(baseball, "team", summarise,id = length(unique(id)))
fdf<-fdf%>% dplyr::filter(id > 199)
bb_longterm <- match_df(baseball, fdf, on="team")
bb_longterm[1:5,]