Cara Membuat Scatter Plot Di Rstudio

Cara Membuat Scatter Plot Di Rstudio

Pola Diagram Scatterplot

Terdapat 3 pola dalam Scatter Diagram yaitu Pola positif, negatif dan pola tidak berkorelasi. Pola positif yaitu pola yang menunjukkan hubungan atau korelasi positif di antara Variabel X dan Variabel Y dimana nilai-nilai besar dari Variabel X berhubungan dengan nilai-nilai besarnya Variabel Y, sedangkan nilai-nilai kecil variabel X berhubungan dengan nilai-nilai kecil Variabel Y. Selanjutnya, pola negatif yaitu pola yang menunjukkan hubungan atau korelasi negatif di antara Variabel X dan Variabel Y dimana nilai-nilai besar Variabel X berhubungan dengan nilai-nilai kecil Variabel Y sedangkan nilai-nilai kecil Variabel X berhubungan dengan nilai-nilai besar Variabel X. Terakhir adalah yaitu Pola yang berkemungkinan tidak memiliki hubungan karena tidak ada kecenderungan nilai-nilai tertentu pada variabel X terhadap nilai-nilai tertentu pada Variabel Y.

Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja

Kapan Menggunakan Scatter Plot?

Scatter plot menjadi pilihan yang tepat dalam beberapa situasi. Pertama, ketika kita ingin menentukan apakah ada hubungan antara dua variabel atau korelasi antara faktor-faktor tertentu, seperti harga dan penjualan atau suhu dan pertumbuhan tanaman.

Selain itu, juga berguna ketika kita ingin memahami pola sebaran atau distribusi data. Saat terdapat pola tertentu, seperti pola linear, quadratic, atau eksponensial, scatter plot akan membantu mengidentifikasinya dengan jelas. Dengan memahami pola sebaran ini, kita dapat membuat prediksi atau memahami lebih baik perilaku variabel yang diamati.

Terakhir, bermanfaat untuk mengidentifikasi outlier atau nilai yang sangat jauh berbeda dari nilai-nilai lainnya. Outlier bisa menjadi insight penting untuk memahami data, misalnya, mengindikasikan kesalahan pengukuran atau kondisi tidak biasa yang mempengaruhi hasil analisis.

Dengan melihat scatter plot, outlier dapat ditemukan dengan mudah karena merupakan titik-titik yang terletak jauh dari pola umum yang terlihat dalam grafik.

Kapan menggunakan Scatter Plot ?

Kegunaan utama scatter plot adalah untuk mengamati dan menunjukkan hubungan antara dua variabel numerik. Titik-titik dalam sebar plot tidak hanya melaporkan nilai titik data individual, tetapi juga pola ketika data diambil secara keseluruhan.

Identifikasi hubungan korelasional yang umum dengan plot pencar. Dalam kasus ini, kami ingin tahu, jika kami diberi nilai horizontal tertentu, prediksi yang baik untuk nilai vertikal. Anda akan sering melihat variabel pada sumbu horizontal dilambangkan sebagai variabel bebas, dan variabel pada sumbu vertikal adalah variabel terikat. Hubungan antar variabel dapat digambarkan dalam banyak cara: positif atau negatif, kuat atau lemah, linier atau nonlinier.

Contoh struktur data Scatter Plot

Untuk membuat plot sebar, kita perlu memilih dua kolom dari tabel data, satu untuk setiap dimensi plot. Setiap baris tabel akan menjadi satu titik dalam plot dengan posisi sesuai dengan nilai kolom.

Referensi : https://chartio.com/learn/charts/what-is-a-scatter-plot/

Capaian Pembelajaran :  Menggunakan diagram pencar untuk menyelediki dan menjelaskan hubungan antara dua variabel numerik

Tujuan Pembelajaran :

1.  Menyajikan diagram pencar dari sepasang data

2.  Menjelaskan hubungan antara dua variabel numerik antara dua variabel

Pengertian Diagram Pencar

Diagram pencar merupakan penyajian data dalam bentuk penyebaran titik-titik pada diagram kartesius yang berguna untuk menunjukkan ada atau tidaknya hubungan/korelasi antara dua variabel kuantitatif yang disebut dengan data bivariat.

Jenis – jenis varibel variabel

1.        Variabel Bebas merupakan variabel yang memberikan pengaruh terhadap variabel lainnya. istilah lain dari variabel bebas yaitu variabel independen/variabel stimulus/ variabel input/variabel predictor/variabel anteseden yang disimbolkan dengan X

2.       Variabel terikat merupakan variabel yang dipengaruhi oleh variabel lainnya tapi tidak dapat mempengaruhi variabel lainnya. Istilah lain dari variabel terikat yaitu variabel dependen/variabel outpot/ variabel respon/variabel criteria/variabel konsekuen yang disimbolkan dengan Y

Menggambar diagram pencar secara manual

1.       Menentukan variabel bebas (X) dan variabel terikat (Y)

2.       Temukanlah nilai tertinggi dan nilai terendah untuk setiap variabel

3.       Membuat diagram kartesius dengan skala yang sama untuk memuat seluruh nilai pada setiap data.

4.       Menggambarkan setiap pasangan titik-titik (X,Y) pada diagram kartesius.

Gambarkan diagram pencar tentang pengaruh jumlah penduduk miskin terhadap jumlah talak dan cerai (pasangan nikah) tahun 2016 di Pulau Sumatera.

Jumlah Penduduk Miskin tahun 2016

Jumlah Talak dan Cerai (Pasangan Nikah) tahun 2016

Variabel bebas (X) :  Jumlah penduduk miskin tahun 2016

Variabel terikat (Y) :  Jumlah talak dan cerai pada pasangan nikah tahun 2016

Nilai minimal (X) =  71071

Nilai maksimal (X) =  1452550

Nilai minimal (Y) =  0

Scatter plot matrices

For a set of data variables (dimensions) X1, X2, ... , Xk, the scatter plot matrix shows all the pairwise scatter plots of the variables on a single view with multiple scatterplots in a matrix format. For k variables, the scatterplot matrix will contain k rows and k columns. A plot located on the intersection of row and jth column is a plot of variables Xi versus Xj.[10] This means that each row and column is one dimension, and each cell plots a scatter plot of two dimensions.[citation needed]

A generalized scatter plot matrix[11] offers a range of displays of paired combinations of categorical and quantitative variables. A mosaic plot, fluctuation diagram, or faceted bar chart may be used to display two categorical variables. Other plots are used for one categorical and one quantitative variables.

Scatter plot adalah sebuah grafik yang biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Untuk bisa menggunakan scatter plot, skala data yang digunakan haruslah skala interval dan rasio.

Contoh grafik scatter plot bisa dilihat seperti gambar dibawah ini :

Gambar 1. Scatter plot

Gambar 1 adalah scatter plot antara prosentase kepemilikan mobil pada suatu kota di Amerika Serikat dengan pendapatan rumah tangga. Gambar 1 menunjukkan bahwa peningkatan prosentase kepemilikan mobil juga diikuti oleh pendapatan rumah tangga.

Gambar 2. Keeratan hubungan

Jika scatter plot membentuk pola yang menyerupai garis lurus seperti pada gambar 2, mengindikasikan bahwa ada hubungan yang erat antara variabel 1 dengan variabel 2.

Hubungan yang membentuk garis lurus biasa disebut dengan hubungan linier. Hubungan linier bisa bisa membentuk hubungan yang positif dan negatif.

Gambar 3. Hubungan positif

Jika plot yang terjadi seperti pada gambar 3, maka variabel 1 dan variabel 2 menunjukkan hubungan yang positif. Peningkatan yang terjadi pada variabel 1 juga diikuti peningkatan pada variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 juga mengalami penurunan

Bahasa mudahnya adalah kalau naik ya naik semua dan kalau turun ya turun semua.

Gambar 4. Hubungan negatif

Jika plot yang terjadi seperti pada gambar 4, maka variabel 1 dan variabel 2 menunjukkan hubungan yang negatif. Peningkatan yang terjadi pada variabel 1 diikuti penurunan oleh variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 akan mengalami peningkatan.

Bahasa mudahnya adalah kalau satunya naik yang lain turun dan kalau satunya turun maka yang lain akan naik.

Gambar 5. Hubungan yang rendah atau tidak ada hubungan

Jika plotnya menyebar seperti pada gambar 5, maka bisa disimpulkan bahwa hubungan antara variabel 1 dengan variabel 2 sangatlah kecil Atau tidak ada hubungan.

Selain hubungan linier, kita juga bisa melihat hubungan yang lain seperti hubungan non linier.

Gambar 6. Hubungan non linier

Jika plot yang terjadi membentuk curva seperti gambar 6, maka diindikasikan terjadi hubungan non linier antara 2 variabel.

Scatter plot juga bisa digunakan untuk melihat penyebaran data. Apakah data menyebar ataukah mengumpul disuatu area.

Gambar 7. Data menyebar

Gambar 8. Data mengumpul di suatu area

Scatter plot juga bisa menunjukkan kita adanya outlier. Outlier adalah data yang ekstrim yang kemungkinan dihasilkan dari situasi yang tidak normal. Kebanyakan peneliti akan mengambil data outlier ini untuk diteliti lebih lanjut.

Istilah scatter plot tidak terasa asing bagi kita. Mungkin Anda telah mengetahuinya bahkan sejak di bangku SMA. Namun penggunaan scatter plot mungkin masih kurang saat kita berada di sekolah.

Dalam visualisasi data, kita perlu menggunakan fitur scatter plot ini. Scatter plot dapat membantu Anda atau audiens Anda dalam memahami data yang memiliki sebuah hubungan korelasi.

Pada artikel saya kali ini, kita akan membahas tentang visualisasi data menggunakan scatter plot. Berikut penjelasannya

Scatter plot atau diagram pencar adalah salah satu jenis visualisasi data. Scatter plot dapat menunjukkan hubungan antara variabel yang berbeda. Data ditampilkan dengan cara menempatkan berbagai titik data antara sumbu x (horizontal) dan sumbu y (vertikal).

Setiap titik data seperti terlihat “tersebar” di sekitar grafik, yang menjadikan nama untuk jenis visualisasi data ini.

Scatter plot juga biasa disebut grafik x-y. Tujuan dari penggunaan scatter plot salah satunya adalah untuk menentukan apakah ada pola atau korelasi antara dua variabel.

Pola atau korelasi antara dua variabel pada scatter plot memiliki fitur yang berbeda, yakni sebagai berikut:

Setiap jenis grafik atau jenis visualisasi data memiliki aturannya tersendiri. Pemilihan grafik yang tepat akan menjadikan visualisasi data yang Anda presentasikan mampu menyuguhkan informasi yang tepat.

Jika Anda mencoba untuk melihat arti dalam dua variabel yang berbeda. Maka scatter plot dapat membantu Anda menentukan apakah ada hubungan potensial antara variabel x dan variabel y.

Sebagai contoh jika Anda memiliki bisnis es krim. Anda ingin mengetahui, apakah ada pola mengapa penjualan Anda rendah akhir-akhir ini. Maka Anda dapat membuat scatter plot untuk mengukur, misal hubungan antara penjualan, dengan suhu luar

Seperti yang terlihat pada grafik di atas, orang-orang cenderung membeli es krim ketika suhu luar ruangan meningkat, sedangkan jika suhu luar ruangan semakin dingin, penjualan akan semakin menurun

Jika Anda memiliki dua variabel yang berpasangan dengan baik, menggunakan scatter plot adalah cara yang tepat untuk melihat hubungan dan melihat apakah korelasinya positif atau negatif.

Sebagai contoh, berat lahir bayi dengan usia kehamilan (berapa lama bayi berada di dalam rahim). Masuk akal jika bay, yang bisa tumbuh di dalam perut ibunya lebih lama akan menjadikan bayi tersebut lebih besar, dan karenanya akan menjadi lebih berat, bukan?

Seperti yang kita dapat perkirakan, Jika semakin lama bayi berada dalam kandungan, maka semakin berat badannya saat lahir

Sama seperti ketika ada waktu tertentu menggunakan scatter plot, maka ada waktu ketika Anda harus menghindari penggunaanya dalam memvisualisasikan data. Berikut waktu Anda harus menghindarinya.

1- Hindari scatter plot, ketika data Anda sama sekali tidak terkait

Jika data Anda menunjukkan bahwa tidak ada korelasi, maka scatter plot tidak akan berguna untuk memvisualisasikan data Anda.

Misalnya, jika Anda mengumpulkan survei acak pada audiens Anda, tentang tinggi tubuh audiens, dengan jumlah hewan peliharaan yang mereka miliki di rumah. Itu sangat tidak masuk akal untuk dihubungkan dalam scatter plot.

Kedua variabel di atas jelas tidak memiliki hubungan apapun, dan meskipun masih menyenangkan untuk dibuat grafik, maka untuk solusinya, Anda bisa beralih ke diagram batang sebagai pilihan yang baik.

2- Hindari scatter plot, ketika Anda memiliki kumpulan data yang terlalu besar

Jika Anda memiliki begitu banyak data, saran dari visme adalah menghindarinya.

Ahli statistik Nathan Yau, menyimpulkan fenomena ini dengan cukup baik dalam grafik di atas.

sebagai contoh lain, lihat scatter plot di bawah ini,. Sangat pada sehingga pada dasarnya menjadi satu kumpalan besar dan sulit untuk memahami isi data dari diagram semacam ini.

Jika memang data Anda terlalu banyak pertimbangkan menggunakan grafik dalam bentuk Heat Map. Ini dapat menunjukkan di mana bagian paling banyak dari data Anda berada

Anda juga dapat memberi kode warna pada berbagai kumpulan data menggunakan titik data tembus cahaya untuk membuat efek seperti heat map dan banyak lagi.

Nah itu tadi pembahasan terkait visualisasi data dengan scatter plot . Nantikan tulisan saya berikutnya ya. feel free to share and give new insight for all.

Contoh Kasus Penggunaan Diagram Scatterplot

Banyak sekali terdapat contoh kasus pada penggunaan diagram scatterplot. Terutama difokuskan pada analisis hubungan antara dua variabel yang tentunya saling terkait. Seperti misalnya, contoh kasus untuk pengujian kekuatan hubungan antara 2 variabel yakni Hubungan antara kecepatan Mesin dengan Kualitas Produk, Hubungan antara Total Jam Lembur dengan tingkat absensi Tenaga Kerja, hubungan work engagement dengan budaya kerja dan produktivitas kerja karyawan.

Cara Buat Scatter Plot di Excel

Untuk memahami cara membuat scatter plot di Excel, yuk praktikkan langsung tutorial di bawah ini. Dalam kasus sederhana berikut, diberikan dua variabel waktu belajar dalam satuan jam dan nilai ujian.

Kita ingin melihat bagaimana korelasi nilai ujian dengan waktu belajar. Untuk contoh ini, berarti variabel Y adalah nilai ujian dan variabel X yaitu waktu belajar.

Langkah 1: Klik dan seret kursor mouse untuk memilih data yang ingin kalian gunakan dalam scatter plot. Dalam contoh ini, pilih sel B2 sampai C10.

Langkah 2: Pilih menu “Insert”. Di grup “Charts” pilih “Scatter”. Ada banyak jenis scatter plot. Untuk tutorial kali ini pilih “Scatter with Straight Lines”.

Langkah 3: Excel akan membuat scatter plot berdasarkan data yang telah kalian pilih.

Langkah 4: Klik pada elemen plot seperti titik-titik data atau sumbu X dan Y untuk memunculkan opsi pengaturan. Kalian dapat memberi judul scatter plot dan label sumbu X dan Y untuk membuatnya lebih informatif.

Nah perhatikan hasil scatter plot dari data di atas. Secara sekilas dapat kita simpulkan adanya hubungan positif dari Waktu belajar (variabel X) terhadap nilai ujian (variabel Y). Ini bisa dilihat dari titik-titik data yang cenderung membentuk pola yang bergerak ke arah kanan atas dalam grafik.

Tapi ingat, kesimpulan ini perlu ditelaah ulang karena hanya dua variabel yang dilihat hubungannya dan tidak mutlak variabel Y hanya dipengaruhi oleh satu variabel X. Tapi setidaknya grafik di atas bisa mendukung hipotesis kalian.

Baca juga : Bootcamp Data Analyst with Excel

Langkah-Langkah Membuat Diagram Scatter Plot di Excel

Dalam membuat diagram scatter (x,y) di excel 2016 sebenarnya sangat simpel. Langkah awal yang harus anda lakukan adalah membuat lembar kerja baru. Setelah itu entrikan/inputkan data anda yang ingin di buat diagram scatter nya. Silahkan ikuti langkah-langkah berikut ini:

1.Input data yang akan dianalisis dan ingin diketahui pengujian hubungannya

2.Blok semua data yang telah diinput

3. Langkah selanjutnya adalah, pilihlah tab insert lalu cari insert scatter (x,y) pada menu chart

4. Pilih design diagram scatter yang diinginkan dan nanti akan muncul diagram scatter sesuai data yang anda inputkan.

5. Setelah diagram anda jadi, anda bisa mengubah desain dan format pada diagram anda. Dengan cara mengklik diagram tersebut dan akan muncul 2 tab baru. Yaitu tab Design dan tab Format. Dalam kedua tab tersebut terdapat banyak tools yang dapat membantu anda untuk mengubah desain dan format diagram anda

Apa itu Scatter Plot?

Scatter plot adalah salah satu jenis grafik statistik yang digunakan untuk menampilkan hubungan antara dua variabel atau lebih dalam bentuk titik-titik pada bidang kartesius. Pada scatter plot, setiap titik mewakili nilai dari dua variabel yang berbeda, dengan satu variabel yang ditempatkan di sumbu horizontal (X) dan variabel lainnya di sumbu vertikal (Y).

Scatter plot sangat berguna untuk mengidentifikasi pola atau tren dalam data, serta untuk menunjukkan sebaran atau distribusi nilai-nilai variabel.

Dengan grafik ini, kita dapat dengan cepat menilai apakah ada korelasi positif yaitu ketika nilai kedua variabel naik bersamaan, korelasi negatif yaitu ketika nilai satu variabel naik sedangkan nilai variabel lainnya turun, atau tidak ada korelasi sama sekali antara variabel-variabel yang diamati.

Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja

Published by adhibagus

Konsultan, Trainer & Designer Visualisasi Data merupakan seorang yang berprofesi dibidang visualisasi dan design data View all posts by adhibagus

Scatter Plot sering juga disebut dengan bagan sebar atau grafik sebar, adalah penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Scatter plot digunakan untuk mengamati hubungan antar variabel.

Contoh Scatter Plot di atas menunjukkan diameter dan tinggi untuk sampel pohon fiksi. Setiap titik mewakili satu pohon; posisi horizontal setiap titik menunjukkan diameter pohon (dalam sentimeter) dan posisi vertikal menunjukkan tinggi pohon (dalam meter).

Dari plot, kita dapat melihat korelasi positif yang secara umum erat antara diameter pohon dan tingginya. Kita juga bisa mengamati titik outlier, sebuah pohon yang diameternya jauh lebih besar dari yang lain. Pohon ini tampak cukup pendek untuk ketebalannya, yang mungkin memerlukan penyelidikan lebih lanjut.