Rabu, 03 Februari 2016
0
Rabu, 03 Februari 2016
mbohtampan@blogspot.com
read more
VIOLING PLOTS-GROUPED VIOLIN PLOTS WITH SPLIT VIOLIN
Memenuhi Tugas Softskill (Desain Permodelan Grafik) Semester 5 (2015/2016)
Pembahasan : Violing plots-Grouped violin plots with split violin
Mata Kuliah : Desain Permodelan Grafik
Mata Kuliah : Desain Permodelan Grafik
KATA PENGANTAR
Puji syukur kehadirat Allah SWT atas limpahan rahmat dan karunianya sehingga Buku Violing Plot-Grouped violinplots with split violins telah dapat diselesaikan. Buku ini merupakan tugas softskill sebagai pedoman bagi mahasiswa Program Teknik Informatika dalam pembelajaran softskill serta memberikan petunjuk praktis agar mahasiswa mendapatkan gambaran secara jelas dalam menyelesaikan penulisan tersebut.
Terimakasih disampaikan kepada Bapak Dr. rer. nat. I Made Wiryana, SKom, SSi, MAppSc selaku dosen pembimbing softskill. Terimakasih juga disampaikan kepada kelas 3ia15 atas kontribusi dalam penyempurnaan buku ini. Terimakasih kepada kelompok 9 softskill kelas 3ia15 yang telah berkontribusi dalam editing dan semua pihak yang telah ikut membantu dalam penyelesaian buku ini.
Kami menyadari masih terdapat kekurangan dalam buku ini untuk itu kritik dan saran terhadap penyempurnaan buku ini sangat diharapkan. Semoga buku ini dapat memberi maanfaat bagi mahasiswa Teknik Informatika khususnya dan bagi semua pihak yang membutuhkan.
Bab 1
Pendahuluan
1.1 Latar Belakang
violin plot berguna untuk membandingkan distribusi. Ketika data dikelompokkan oleh faktor dengan dua tingkat (misalnya laki-laki dan perempuan), Anda dapat split dua violin untuk melihat perbedaan antara kelompok. Pertimbangkan percobaan faktorial 2 x 2: perawatan A dan B disilangkan dengan kelompok 1 dan 2, dengan N = 1000.
Boxplots sering digunakan: par (bty = “n”) boxplot (nilai ~ kelompok * pengobatan, main = “Box plot”, col = r (c (“ungu”, “biru muda”), 2))
Gambar ini memberi kita perbandingan kasar dari distribusi di masing-masing kelompok, tapi kadang-kadang itu bagus untuk memvisualisasikan perkiraan kepadatan kernel sebagai gantinya.Dengan ggplot2 (), argumen sisi menentukan apakah untuk merencanakan kepadatan pada “kanan”, “kiri”, atau “kanan”.
1.2 Tujuan Penulisan
1.3 Perumusan Masalah
Bab 2
Violing Plot – Grouped violinplots with split violins
2.1 Menggambar violin plot
Paket boxplot Peter Kamstra menggunakan boxplot () untuk membuat plot kepadatan split, tapi 1) plot karpet daripada kotak kuantil, 2) mencakup garis untuk mean keseluruhan atau median, dan 3) membuat lebih mudah untuk mengubah fungsi kernel.
Ada lebih dari satu cara untuk skin a cat, dan apa yang digunakan mungkin akan masuk ke preferensi pribadi.
Seaborn.violin plot (x = None, x = None, warna = None, data = None, order = Tidak ada, agar warna = None, bw = ‘scott’, potong = 2, skala = ‘daerah’, scale_warna = True, gridsize = 100, lebar = 0,8, ‘kotak’ = batin, split = False, orientasi = None, linewidth = Tidak ada, warna = None, palet = None, saturasi = 0,75, kapak = None, ** kwargs) Menggambar kombinasi boxplot dan estimasi densitas kernel. Sebuah violin plot memainkan peran yang sama sebagai plot dan whisker plots. Ini menunjukkan distribusi data kuantitatif di beberapa tingkat satu (atau lebih) variabel kategori seperti bahwa mereka distribusi dapat dibandingkan. Tidak seperti plotbox, di mana semua komponen rencana sesuai dengan data points yang sebenarnya, violin plot memiliki estimasi densitas kernel dari distribusi yang mendasarinya. Hal ini dapat menjadi cara yang efektif dan menarik untuk menampilkan beberapa distribusi data sekaligus, namun perlu diingat bahwa prosedur estimasi dipengaruhi oleh ukuran sampel, dan violin untuk sampel yang relatif kecil mungkin terlihat menyesatkan halus. Input data dapat dikirimkan dalam berbagai format, termasuk: Vektor data direpresentasikan sebagai daftar, array numpy, atau benda panda Series lulus langsung dengan parameter x, y, dan / atau warna. Sebuah “bentuk panjang” DataFrame, dalam hal ini x, y, dan variabel warna akan menentukan bagaimana data diplot. A “wide-bentuk” DataFrame, sehingga setiap kolom numerik akan diplot. Apa pun diterima oleh plt.boxplot (misalnya array 2d atau daftar vektor) Dalam kebanyakan kasus, adalah mungkin untuk menggunakan numpy atau Python objek, tetapi objek pada phyton lebih disukai karena nama-nama yang terkait akan digunakan untuk mendefinisikan keterangan sumbu. Selain itu, Anda dapat menggunakan jenis kategori untuk variabel pengelompokan untuk mengontrol urutan elemen plot. Parameter: x, y, warna, nama variabel dalam data atau data vektor, Input opsional untuk merencanakan data formulir panjang. Lihat contoh untuk interpretasi Data yaitu DataFrame Tidy (“bentuk panjang”) dataframe mana setiap kolom adalah variabel dan setiap baris adalah pengamatan. order, warna_order, daftar string, Orde opsional untuk merencanakan tingkat kategoris dalam, jika tingkat yang disimpulkan dari objek data. bw: {‘scott’, ‘silverman’, float}, opsional Entah nama aturan referensi atau faktor skala untuk digunakan saat menghitung bandwidth kernel. Ukuran kernel yang sebenarnya akan ditentukan dengan mengalikan faktor skala dengan standar deviasi dari data dalam setiap bin dipotong float, opsional Jarak , dalam satuan ukuran bandwidth, untuk memperpanjang kepadatan masa lalu datapoints ekstrim. Set ke 0 untuk membatasi rentang violin dalam kisaran data yang diamati (yaitu, memiliki efek yang sama seperti langsing = True dalam skala ggplot:. {“Daerah”, “menghitung”, “width”}, opsional Metode yang digunakan untuk skala lebar setiap violin. Jika daerah, masing-masing violin akan memiliki area yang sama. Jika jumlah, lebar violin akan ditingkatkan dengan jumlah pengamatan di bin itu. Jika lebar, masing-masing violin akan memiliki lebar yang sama. scale_warna: bool, opsional Ketika bersarang violin menggunakan variabel rona, parameter ini menentukan apakah scaling dihitung dalam setiap tingkat variabel pengelompokan utama (scale_warna = True) atau di semua violin pada plot (scale_warna = False) gridsize. int Jumlah opsional poin di grid diskrit digunakan untuk menghitung estimasi kepadatan kernel width:.. float, Lebar opsional dari elemen penuh saat tidak menggunakan rona bersarang, atau lebar semua elemen untuk satu tingkat dari variabel pengelompokan utama dalam : {“kotak”, “kuartil”, “titik”, “tongkat”, ada}, Perwakilan opsional dari datapoints di pedalaman violin. Jika kotak, menggambar boxplot miniatur. Jika kuartil, menarik kuartil dari distribusi. Jika titik atau tongkat, menunjukkan setiap datapoint yang mendasari. Menggunakan Tidak akan menarik violin tanpa hiasan. perpecahan: bool, opsional Bila menggunakan rona bersarang dengan variabel yang mengambil dua tingkat, pengaturan split Benar akan menarik setengah dari violin untuk setiap tingkat. Hal ini dapat membuat lebih mudah untuk langsung membandingkan distribusi. orient: “v” | “H”, Orientasi opsional plot (vertikal atau horizontal). Ini biasanya disimpulkan dari type variabel input, tetapi dapat digunakan untuk menentukan kapan “kategoris” variabel adalah lebar bentuk data numerik atau ketika merencanakan. linewidth,float, Lebar opsional garis abu-abu yang membingkai elemen plot. warna: warna matplotlib, Warna opsional untuk semua elemen, atau benih untuk light_palette () bila menggunakan warna bersarang. palet: palet warna Seaborn atau dict, Warna opsional untuk digunakan untuk berbagai tingkat variabel rona. Harus sesuatu yang bisa ditafsirkan oleh color_palette (), atau tingkat pemetaan rona kamus matplotlib warna. saturasi: float, Proporsi opsional saturasi asli untuk menggambar warna pada. Patch besar sering terlihat lebih baik dengan warna sedikit desaturated, tetapi mengatur ini untuk 1 jika Anda ingin warna rencana untuk sempurna sesuai spec warna masukan. kapak: Matplotlib Axes, Axes opsional keberatan untuk menarik plot ke, jika tidak menggunakan Axes saat ini. Pengembalian: kapak: Matplotlib Axes Mengembalikan objek Axes dengan boxplot ditarik ke atasnya. Lihat juga boxplot Sebuah plot kotak-dan-kumis tradisional dengan API yang sama. stripplot A sebar di mana satu variabel kategoris. Dapat digunakan dalam hubungannya dengan plot lain untuk menunjukkan setiap pengamatan. Contoh Menggambar violinplot horizontal tunggal:
2.1.1 Violinplot horizontal tunggal
2.1.2 Violin plot vertikal
2.1.3 Violin plot bersarang
2.1.4 Violin untuk perbandingan
2.1.5 Violin plot rangka
2.1.6 Violin plot dengan perintah eksplisit
2.1.7 Menggambar kuartil sebagai garis horizontal bukan mini-kotak
2.1.8 Menggunakan bandwidth sempit
2.1.9 Violin plot horizontal
2.1.10 Violin plot pada sebuah FacetGrid
ggplot2.violinplot adalah mudah untuk menggunakan fungsi-fungsi kustom untuk merencanakan dan menyesuaikan dengan mudah violin plot menggunakan ggplot2 dan software R. Fungsi ggplot2.violinplot adalah dari mudah paket ggplot2 R. Script R tersedia dalam bagian berikutnya untuk menginstal paket. violin plot mirip dengan kotak plot, kecuali bahwa mereka juga menunjukkan kepadatan probabilitas kernel dari data pada nilai yang berbeda. Biasanya violin plot akan mencakup penanda untuk median dari data dan kotak yang menunjukkan kisaran interkuartil, seperti dalam plot kotak standar (wiki). Tujuan dari tutorial ini adalah untuk menunjukkan Anda langkah demi langkah, bagaimana plot dan menyesuaikan violin plot menggunakan fungsi ggplot2.violin petak [paket ggplot2 mudah]. Pada akhir tutorial ini Anda akan dapat menarik, dengan beberapa kode R, plot berikut
2.2 Data format
Data harus menjadi vektor numerik atau data.frame sebuah (kolom dan baris adalah variabel adalah pengamatan).
ToothGrowth menggambarkan efek dari vitamin C pada pertumbuhan gigi di Guinea. Tanggapan adalah panjang (len) gigi di setiap dari 10 kelinci percobaan di masing-masing tiga tingkat dosis Vitamin C (0,5, 1, dan 2 mg) dengan masing-masing dua metode pengiriman (jus jeruk atau asam askorbat). Data adalah data frame dengan 60 pengamatan pada 3 variabel. * [, 1] len Tooth panjang numerik. * [, 2] Jenis faktor supp Tambahan (VC atau OJ). * [, 3] dosis Dosis numerik dalam miligram.
2.3 Basic violin plot
# Change the orientation: Horizontal violin plot ggplot2.violinplot(data=df, xName=’dose’,yName=’len’, orientation=”horizontal”)
violin plot dengan rata-rata titik dan titik
Setiap titik mewakili satu observasi dan titik berarti sesuai dengan nilai rata-rata dari pengamatan di kelompok tertentu.
ggplot2.violinplot(data=df, xName=’dose’,yName=’len’, addMean=TRUE, meanPointShape=23, meanPointSize=3, meanPointColor=”black”, meanPointFill=”blue”)
ggplot2.violinplot(data=df, xName=’dose’,yName=’len’, addDot=TRUE, dotSize=1.7, dotPosition=”jitter”, jitter=0.2)
Mengubah violin petak jenis garis dan titik bentuk
Bentuk titik yang berbeda dan jenis garis dapat digunakan dalam plot. Secara default, ggplot2 menggunakan jenis garis padat dan bentuk lingkaran.
Bentuk titik yang berbeda di R dijelaskan di sini. Jenis garis yang tersedia akan ditampilkan di sini.
Menyesuaikan rencana violin
Judul utama dan sumbu label
Axis ticks
Background and colors
Mengubah violin warna petak menurut kelompok
Warna dapat ditentukan sebagai heksadesimal RGB triplet, seperti “# FFCC00” atau dengan nama (misalnya: “red”). Anda juga dapat menggunakan skala warna lain, seperti yang diambil dari paket RColorBrewer. Sistem warna yang berbeda
Untuk mengubah violin warna petak menurut kelompok, Anda harus menentukan nama kolom data yang berisi grup menggunakan groupName argumen. Gunakan groupColors argumen, untuk menentukan warna dengan kode heksadesimal atau dengan nama. Dalam hal ini, panjang groupColors harus sama dengan jumlah kelompok. Menggunakan argumen bir Palette, untuk menentukan warna menggunakan RColorBrewer palet.
Legend
LEGEND POSITION
Hal ini juga memungkinkan untuk posisi legenda dalam area merencanakan. Anda harus menunjukkan x, y koordinat kotak legenda. x dan y nilai-nilai harus antara 0 dan 1. c (0,0) sesuai dengan “kiri bawah” dan c (1,1) sesuai dengan “kanan atas” posisi.
Legend background color, title and text font styles
Mengubah urutan item dalam legenda, menghapus legenda petak
Axis scales
Buat plot disesuaikan dengan beberapa kode R
violin plot dengan beberapa kelompok
Facet: split plot ke dalam matriks panel
Pendekatan aspek split plot ke dalam matriks panel. Setiap panel menunjukkan subset yang berbeda dari data.
Facet dengan dua variables
Facet scales
Secara default, semua panel memiliki skala yang sama (Timbangan faceting = “tetap”). Mereka dapat dibuat bebas, dengan menetapkan skala untuk free, free_x, atau free_y.
Seperti yang Anda lihat di plot di atas, sumbu y memiliki skala yang berbeda dalam panel yang berbeda.
Label penampilan Facet
ggplot2.violin plot fungsi
PEMAKAIAN
Mereka digunakan untuk menyesuaikan plot (sumbu, judul, latar belakang, warna, legenda, ….) Dihasilkan menggunakan ggplot2 atau mudah paket ggplot2 R.
plot<-ggplot2.customize(plot, mainTitle=”Plot of length according\n to the dose”, xtitle=”Dose (mg)”, ytitle=”Length”) print(plot)
Nilai(Value)
group : vektor dari panjang yang sama sepertir unsur yang keluar menunjukkan ke kelompok milik outlier.
EXAMPLES
Violin plot.
KEGUNAAN : GEOM_VIOLIN(MAPPING = NULL, DATA = NULL, STAT = “YDENSITY”, POSITION = “DODGE”, TRIM = TRUE SCALE = “AREA”, …)
PENJELASAN :
TRIM
jika “daerah” (default), semua violin memiliki wilayah yang sama (sebelum pemangkasan ekor). Dari “menghitung”, daerah yang skala proporsional dengan jumlah observasi. Jika “lebar”, semua violin memiliki maksimum yang sama lebar.
Pemetaan estetika, biasanya dibangun dengan aes atau aes_string. Hanya perlutingkat lapisan jika Anda override default petak data.
argumen lain diteruskan nanti. Hal ini dapat mencakup estetika yang nilainya Anda ingin mengatur, tidak peta. Lihat lapisan untuk lebih jelasnya.
Estetika
PlotViolin(x ~ f, col = SetAlpha(“steelblue”,0.3), bw = “SJ”, horizontal = TRUE, las=1, main=”Horizontal”)
main = “Guinea Pigs’ Tooth Growth”, xlab = “Vitamin C dose mg”, ylab = “tooth length”, col=c(“yellow”, “orange”), lty=c(1,2) )
col=c(“yellow”, “orange”), lty=c(1,2) ) # use points, if the medians deserve special attention points(x=1:6, y=b$stats[3,], pch=21, bg=”white”, col=”black”, cex=1.2)
Bab 3
GGPLOT2
3.1 Fungsi ggplot2
MENGAPA MENGGUNAKAN GGPLOT2?
Ini bukan hanya software dengan paket biasa, itu adalah gaya hidup konseptual! Tidak hanya memberikan set plot, plot r juga memberikan Anda kemampuan untuk ‘berbicara’ mengenai visualisasi data.
3.2 Cara penggunaan ggplot2
Tujuan dari bagian ini adalah untuk memotivasi mengapa Anda mungkin ingin menggunakan ggplot daripada grafis R dasar. Untuk memulainya, kita akan memuat ggplot2 paket yang berisi fungsi kita perlukan untuk bagian pertama dan dua data.frames data: kita sudah melihat dataset iris. Dataset kedua adalah warna, potong, kejelasan, karat dan harga sekitar 60.000 berlian yang. Karena data berlian yang begitu besar, kami akan mengambil sub-sampel dari 1.000 poin:
library(ggplot2); data(iris); data(diamonds) diamonds.sampled <- diamonds[ sample(1:nrow(diamonds), 1000),]
Sebagai contoh pertama, mari kita berpikir tentang plot pencar, untuk memulai dengan, kita akan menggunakan paket R dasar. Ketika kita memberitahu R untuk membuat sebar, kita harus mengatakan itu nilai-nilai apa yang ‘X’ akan dan apa nilai-nilai ‘Y’ akan:
Anda bisa membayangkan sebuah algoritma yang memberitahu R untuk pergi ke setiap baris dalam tabel nilai, menemukan kolom untuk panjang Sepal, maka kolom untuk panjang petal, dan akhirnya, menggambar titik di mana kedua hal berpotongan. Cara lain untuk mengatakan ini adalah bahwa koordinat horizontal dipetakan ke kolom tertentu dari data (panjang sepal) dan koordinat vertikal dipetakan ke kolom lain (panjang petal). Kita bisa membumbui rencana kami sedikit dengan menambahkan beberapa warna untuk sesuai dengan spesies. Namun, ini sebenarnya melibatkan sedikit wajar kode agak jelas:
#Since factors are encoded as numbers and a list of levels, we can index #the color vector using the numeric version of the species plot( x = iris$Sepal.Length, y = iris$Petal.Length, col = COLORS[ as.numeric( iris$Species ) ] )
#Finally, we can add a legend legend( “topleft”, pch = 1, col = COLORS, legend = levels( iris$Species ) )
Sekarang kami memiliki tiga pemetaan: satu dari panjang sepal ke X, satu dari panjang kelopak ke Y, dan satu dari spesies ke warna. Dalam istilah dari ggplots, pemetaan ini disebut ‘pemetaan estetika dan cara pemetaan ini ditarik pada plot disebut’ geometri, ‘atau’ GEOM. ‘Menggunakan ggplot, kita dapat membuat plot yang sama, tetapi dengan sintaks yang berbeda sedikit:
Fungsi ‘ggplot’ membutuhkan dua argumen: pertama adalah data.frame bahwa plot Anda akan terbuat dari (iris dalam kasus ini). Yang kedua adalah fungsi yang disebut ‘aes’ yang menentukan pemetaan estetika. Dalam hal ini, kami diberitahu ggplot bahwa kami ingin panjang sepal pada sumbu x, panjang kelopak pada sumbu y, dan warna yang akan dikodekan oleh spesies. Namun, kita bisa memilih sejumlah pemetaan estetika lainnya. Kita bisa menggunakan bentuk:
Ada cukup banyak keuntungan untuk pendekatan ini daripada mencoba untuk meniru plot ini dengan grafis dasar:
2.Kode ini sangat mudah untuk mengubah. Daripada harus mencari cara untuk memetakan secara manual ukuran titik ke sebuah variabel menggunakan beberapa kode R sulit, itu hanya sesederhana mengatakan untuk mengatur ‘ukuran’ sama dengan ‘variabel’.
Bab 4
Pemanfaatan ggplot2 untuk grafis
Mungkin kendala terbesar untuk belajar ggplot grafis adalah bahwa kita perlu belajar sintaks yang berbeda untuk menjalankannya.Pada bab ini juga akan menjelaskan komponen yang terdapat dalam ggplot2. Kita sudah melihat fungsi ‘ggplot’ itu sendiri. Argumen pertama adalah selalu bingkai data. Frame data adalah salah satu yang ggplot gunakan untuk mencari semua pemetaan yang Anda tetapkan dalam potongan plot selanjutnya.Yang menyenangkan disini adalah bahwa tidak ada kebutuhan untuk menggunakan notasi tanda dolar(string).Anda bisa mengatur di plot dasar dengan menentukan komentar pada data.Argumen kedua fungsi yang disebut ‘aes’. Aes mengambil nama argumen. Setiap nama argumen adalah ‘estetika’ bahwa Anda ingin memepetakan sesuatu ke kolom tertentu dalam data. Cara Anda menentukan pemetaan adalah dengan menulis estetika (yaitu ukuran) ‘=’ nama kolom. (Perhatikan bahwa nama kolom tidak dalam tanda kutip) Sebagai contoh, jika kita ingin karat berlian berada di sumbu x dan harga berlian berada di sumbu y, kita akan menulis:
Jika Anda menjalankan fungsi ini, tidak ada yang akan diplot karena belum memberitahu ggplots bagaimana cara menampilkan pemetaan estetika yang dibuat. Untuk melakukan hal ini, kita perlu GEOM a.
4.1 Geoms
Ada banyak geoms berbeda dapat Anda gunakan untuk plot data Anda. Ada contoh yang paling umum di bawah ini, tetapi pastikan untuk teliti dalam dokumentasi ggplot untuk melihat berbagai kebutuhan dalam kotak peralatan Anda.
4.2 Titik
Mungkin GEOM sederhana untuk bekerja dengan adalah titik. Di tanah ggplot, semua gen yang dikodekan sebagai fungsi R. Sintaks yang digunakan untuk menambahkannya ke plot hanyalah sebuah tanda ‘+’:
geoms yang modular, sehingga Anda dapat menambahkan banyak dari mereka untuk plot yang Anda inginkan (seperti yang akan Anda lihat di bawah). Setiap GEOM memiliki estetika tertentu yang harus didefinisikan dalam plot dalam rangka untuk itu harus diplot. Dalam kasus geom_point, hanya estetika yang diperlukan adalah ‘x’ dan ‘y’. Namun, hampir semua cara yang mungkin Anda bisa memikirkan untuk mengubah titik dapat diatur sebagai pemetaan estetika (seperti yang kita lihat di atas). Atau, jika Anda hanya ingin semua poin yang akan diplot dengan cara tertentu, Anda dapat mengatur setiap aspek estetika mereka di luar fungsi panggilan aes:
Yang menyenangkan tentang ggplot adalah bahwa sekali kita memiliki potongan-potongan ini untuk bermain dengan plot, kita bisa mulai main-main untuk membuat seluruh berbagai plot. Misalnya, dengan menetapkan nilai x ke nilai-nilai diskrit dan nilai y dengan nilai-nilai yang terus menerus, kita mendapatkan apa yang orang sebut ‘strip plot yang’:
Namun, rencana ini cukup sulit untuk dibaca karena ada begitu banyak data. Salah satu solusi untuk ini adalah bahwa poin dapat ‘bergoyang’ untuk menghindari overplotting:
ggplot( diamonds.sampled, aes(x=cut, y=price))+ geom_point(position=position_jitter( width = 0.05, height = 0) )
ggplot( diamonds.sampled, aes(x=cut, y=price))+ geom_point(position=position_jitter( width = 0.2, height = 0) )
ggplot( diamonds.sampled, aes(x=cut, y=price))+ geom_point(position=position_jitter( width = 0.1, height = 0), alpha = 0.1)
4.3 Violin
Pendekatan lain untuk masalah overplotting dalam grafik strip untuk melakukan ‘violin’ Plot gantinya:
Seperti yang saya sebutkan di atas, ggplot adalah modular. Jadi, tidak ada yang menghentikan kita dari menggunakan lebih dari satu GEOM. Sebagai contoh, kita bisa plot poin di samping violin plot. Perhatikan bahwa saya mengatur isi dari violin dan warna violin untuk membuat apa yang saya pikir adalah plot yang lebih menyenangkan:
geom_violin(fill=NA, col=’blue’)+ geom_point(position=position_jitter( width = 0.1, height = 0), alpha = 0.1)
4.4 Box
Jika data Anda yang lebih atau kurang terdistribusi secara normal, kotak petak dapat digantikan untuk stripplot atau violin plot:
4.5 Histograms
Jika data Anda tidak terdistribusi normal, dan jika Anda peduli tentang frekuensi absolut data, histogram selalu baik.
4.6 Massa jenis
Jika Anda tidak ingin menentukan jumlah sampah dan Anda tidak peduli tentang jumlah absolut dari pengamatan untuk nilai tertentu, plot kepadatan kadang-kadang tepat:
4.7 Garis
Untuk menunjukkan beberapa aspek ggplot, kita akan menggunakan beberapa data yang saya dihasilkan. Data adalah densitas optik (OD) dari beberapa budaya ragi unggulan menjadi 96 piring dengan baik. Ada tiga jenis yang berbeda ragi, empat kondisi media yang berbeda, dan delapan pengenceran awal yang berbeda dari budaya jenuh dalam media segar. Pertama, kita akan membaca dalam data dan membuat beberapa subset untuk kemudahan merencanakan:
growth.PMY1529 <- subset(growth, (strain == “PMY1529”) & (initial_dilution == 270))growth.270 <- subset(growth, (initial_dilution == 270))
Karena ada empat jenis media, merencanakan subset dari data yang berisi jumlah pengenceran tunggal dan strain tunggal memiliki empat baris jelas sesuai dengan media:
Namun, jika kita hanya mencoba untuk menggantikan garis untuk titik, kita mendapatkan sesuatu yang tampak tidak dapat dimengerti:
Hal ini karena Anda harus menentukan apa yang ‘kelompok’ dari nilai-nilai yang ggplot harus terhubung. Untuk melihat ini, kami akan mengambil bagian tambahan data untuk membatasi diri untuk hanya satu jenis media. Selama hanya ada satu set data untuk menangani, pendekatan kami bekerja OK:
Cara Anda memberitahu ggplot untuk menghubungkan set berbeda poin dalam data ini adalah untuk mengatur ‘kelompok’ estetika:
Alih-alih pengaturan kelompok estetika, kita bisa juga hanya mengatur warna menjadi jenis media. ggplot cukup pintar untuk menghubungkan seperti poin berwarna ketika menggunakan geom_line.
Namun, jika kita ingin split oleh semua jenis media, namun warna dengan hanya konsentrasi dekstrosa, kita bisa menentukan baik warna dan kelompok:
Anehnya, Anda tidak dapat melakukan trik yang sama dengan boxplots. Misalnya, mengatakan bahwa saya ingin setiap ‘x’ yang akan diwarnai oleh ‘warna’ dan dikelompokkan oleh ‘kejelasan:’
Alasan mengapa hal ini terjadi adalah rumit, tapi itu baik untuk menyadari fakta. Yang terbaik yang dapat Anda lakukan memiliki keduanya ‘warna’ dan ‘x’:
4.8 Tile
Kadang-kadang Anda memiliki dua variabel yang dievaluasi untuk variabel ketiga di grid merata spasi (berpikir dari lanskap kebugaran). Dalam hal ini, Anda dapat menggunakan ‘ubin’ GEOM untuk ubin warna sesuai dengan nilai pada yang mengkoordinasikan:
Bab 5
Penutup
A. Kesimpulan
Violin plots berguna untuk membandingkan distribusi. Ketika data dikelompokkan oleh faktor dengan dua tingkat (misalnya laki-laki dan perempuan), Anda dapat split dua violin untuk melihat perbedaan antara kelompok. Karena banyak macam dari viloin plots maka dibentuk ke dalam kelompok-kelompok.Perbedaan dalam pengelompokan violin plots dapat dibedakan melalui warna,bentuk maupun ukuran nya .Software yang kami gunakan disini adalah ggplot2.Mungkin kendala terbesar untuk belajar ggplot grafis adalah bahwa kita perlu belajar sintaks yang berbeda untuk menjalankannya. Ggplot2tidak hanya memberikan set plot, plot r juga memberikan Anda kemampuan untuk ‘berbicara’ mengenai visualisasi data. Ada banyak yang dapat dilakukan dengan ggplot2 misalkan menentukan koordinat violin, membuat violin dari beberapa titik maupun pewarnaan dari violin. Jadi tujuan dari pembuatan buku ini adalah untuk menambah wawasan pembaca tentang pengelompokkan violin plot dengan memecahnya kedalam beberapa vilon plot yang dijelaskan pada bab kedua dalam buku ini.
B. Saran
Dari pembahasan yang telah di tulis mungkin kendala terbesar untuk belajar ggplot grafis adalah bahwa kita perlu belajar sintaks yang berbeda untukmenjalankannya.Kita harus tau syntax yang tepat dalam membuat violin plot dari pengelompokkan viloin plot tersebut. Untuk mengubah violin warna petak menurut kelompok, Anda harus menentukan nama kolom data yang berisi grup menggunakan groupName argumen. Gunakan groupColors argumen, untuk menentukan warna dengan kode heksadesimal atau dengan nama. Dalam hal ini, panjang groupColors harus sama dengan jumlah kelompok.
DAFTAR PUSTAKA
Waskom,Michael.2012 Grouped violin plots with split violin,http://stanford.edu/~mwaskom/software/seaborn/examples/grouped_violinplots.html
President and Fellows of Harvard College.2011 Split violin plots,http://tagteam.harvard.edu/hub_feeds/1981/feed_items/209875
Langganan:
Postingan (Atom)