Итоги штрихового графика по месяцам с помощью ggplot?

У меня есть данные временного ряда (я разместил их здесь как data.frame):

x <- structure(list(date = structure(c(1264572000, 1266202800, 1277362800, 
1277456400, 1277859600, 1278032400, 1260370800, 1260892800, 1262624400, 
1262707200), class = c("POSIXt", "POSIXct"), tzone = ""), data = c(-0.00183760994446658, 
0.00089738603087497, 0.000423513598318936, 0, -0.00216496690393131, 
-0.00434836817931339, -0.0224199153445617, 0.000583823085470003, 
0.000353088613905206, 0.000470295331234771)), .Names = c("date", 
"data"), row.names = c("1", "2", "3", 
"4", "5", "6", "7", "8", "9", "10"
), class = "data.frame")

Как лучше всего изобразить это как гистограмму в ggplot, которая будет показывать общее значение за месяц (с названием месяца в виде текста)?

Я могу сделать это вручную, добавив поле месяца:

x$month <- format(x$date, format="%B")
ddply(x, .(month), function(x) sum(x[, "data"]))

Затем строим график независимо, но месяцы не упорядочены правильно с использованием этого подхода (предположим, что мне нужно создать упорядоченный коэффициент?); Я также предполагаю, что с ggplot есть более простой способ.


person griffin    schedule 16.08.2010    source источник


Ответы (1)


Я ни в коем случае не эксперт с данными временных рядов, но этот код у меня сработал:

#The binning by month, saving as a date
x$month <- as.Date(cut(x$date, breaks = "month"))

#Plotting
p <- ggplot(x, aes(month, data))+
     stat_summary(fun.y = sum, geom = "bar")

#My suggestions for display
minmax <- max(abs(x$data))

p + geom_hline(y = 0)+
    scale_x_date(minor = "month")+
    ylim(-minmax, minmax)
    # or more ggplot2 accurately
    #+coord_cartesian(ylim = c(-minmax, minmax))

С моими предложениями вы в конечном итоге выделите ноль линией, а оси Y симметричны относительно 0. Я изменил второстепенные линии сетки оси X на «месяц», потому что полоса для каждого месяца увеличилась на несколько недель в каждом направлении, что на самом деле не имеет значения для агрегирования данных.

Изменить: Конечно, большая часть этого кода была предназначена только для создания ежемесячных сумм. Если ваши данные даты находятся в формате даты, шкалы даты автоматически используются для осей. Чтобы изменить основные x-разрывы и их формат, вы делаете это с помощью scale_x_date()

p + scale_x_date(major = "month", format = "%b")
#or
p + scale_x_date(major = "month", format = "%B %Y")

См. ?strftime для получения подробной информации о том, что означают строки формата.

person JoFrhwld    schedule 16.08.2010