Rabu, 20 Maret 2024

Pre Test Praktikum Komputasi Big Data

Pre Test

Minggu 1

Sebuah nilai yang menggambarkan keeratan hubungan atau nilai kekuatan hubungan dan arah hubungan dari dua variabel disebut ... 

Select one: 

a. regresi 

b. variance 

c. Standar Deviasi 

d. korelasi 

e. interpolasi


Sebuah teori statistik yang menyatakan keragaman sampel serta bagaimana nilai-nilai data tersebar dikenal sebagai 

 Select one: 

a. interpolasi 

 b. standar deviasi 

c. regresi 

 d. uji statistik 

 e. variance 


Statistik deskriptif adalah pendekatan statistik yang digunakan untuk menggambarkan atau menganalis hasil penelitian, tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas (general/inferensi). 

 Select one: 

True

False


Pendekatan statistik non-parametrik adalah ilmu statistik yang mempertimbangkan jenis sebaran atau distribusi data, apakah data menyebar secara normal atau tidak. Dengan kata lain, data yang akan dianalisis menggunakan pendekatan ini harus memenuhi asumsi normalitas. 

 Select one: 

 True 

 False


Statistic inferensial adalah pendekatan statistik yang digunakan untuk menganalisis data sampel, dan hasilnya akan digeneralisasikan untuk populasi dimana sampel diambil.

Select one:

True

False


Minggu 2

Pendekatan statistik dapat digunakan untuk menguji validitas dan reliabilitas instrument penelitian Select one: 

True

False


Kuartil adalah istilah statistik yang menggambarkan pembagian pengamatan menjadi empat interval yang ditentukan berdasarkan nilai data dan bagaimana perbandingannya dengan seluruh rangkaian pengamatan.

Select one: 

 True 

False


Kuartil ketiga (O3) adalah nilai tengah antara median dan nilai terkecil (minimum) dari kumpulan data. 

Select one: 

True 

False


Metode analisis kuartil dapat digunakan untuk mendeteksi adanya outlier

Select one:

True

False


Dalam distribusi normal, standar deviasi yang tinggi berarti bahwa nilai umunya jauh dari mean, sedangkan standar deviasi yang rendah menunjukkan bahwa nilai-nilai berkerumun dekat dengan mean.

Select one:

True

False


Minggu 3

Anda telah melakukan beberapa teknik visualisasi pada praktikum sebelumnya

Select one:

True

False


Berikut adalah library yang dapat Anda gunakan untuk membuat visualisasi pada bahasa pemrograman python

Select one:

a. numpy

b. cupy

c. pandas

d. seaborn

e. scipy


Histogram adalah salah satu jenis dari bar plot

Select one:

True

False


Di bawah ini yang merupakan kegunaan dari teknik visualisasi adalah? 

a. Mengidentifikasi kelompok objek serupa dalam kumpulan data dengan dua atau lebih besaran variabel. 

 b. Memperindah tampilan data 

c. Membantu seseorang melihat, berinteraksi dan memahami data dengan lebih baik 

d. Menjaga kerahasiaan, integritas, dan ketersediaan data.


Teknik analisis statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data 

Select one: 

a. univariate 

 b. kuantitatif 

c. kualitatif 

 d. deskriptif 

e. bivariate 


Minggu 4

jenis analisis ini menganalisis kumpulan data yang berupa frekuensi, nilai dengan frekuensi terbanyak, nilai minimum dan nilai maksimum dari suatu variabel penelitian. 

 Select one: 

 a. teknik kualitatif 

 b. teknik kuantitatif 

c. univariate analysis 

d. tukin analysis 

 e. bivariate analysis 


Teknik Analisis yang dilakukan untuk menganalisis hubungan dari dua variabel adalah ... 

 Select one: 

 a. analysis non-parametrik 

 b. univariate analysis 

c. analysis parametrik 

 d. multivariate analysis 

 e. bivariate analysis


Dibawah ini yang merupakan distribusi yang biasa digunakan sebagai acuan distribusi normal adalah Select one: 

 a. distribusi histogram 

 b. distribusi paramtetrik 

c. distribusi spasial 

 d. distribusi deskriptif 

 e. distribusi gauss


Jenis diagram yang biasa digunakan untuk melakukan analisa distribusi adalah ... 

 Select one: 

 a. Scatter plot 

b. Heatmap 

c. Boxplot 

 d. Line plot 

 e. histogram


Anda dapat mengetahui data yang bersifat outlier, dengan menggunakan diagram boxplot

Select one:

True

False


Minggu 5

Tidak semua dataset dapat langsung digunakan atau di analisa.

Select one:

True

False


Tahapan data preparation merupakan salah satu tahapan penting dalam pembagunan sebuah model berbasis AI.

Select one:

True

False


Tahapan data cleansing adalah tahapan yang dilakukan untuk memilih fitur yang akan digunakan untuk selanjutnya digunakan dalam pembangunan model.

Select one:

True

False


Tipe data ordinal adalah data yang bersifat kualitatif yang merepresentasikan sebuah skala atau order.

Select one:

True

False


Anda dapat menerapkan model AI yang sudah dibangun kedalam aplikasi berbentuk mobile maupun website

Select one:

True

False


Minggu 6

Tujuan telaah data adalah untuk memberikan gambaran awal tentang, kecuali ...

Select one:

a. Tujuan data 

b. Tingkat kesesuaian data dengan masalah bisnis yang akan dipecahkan 

c. Identifikasi kekurangan dan batasan penggunaan data 

 d. Identifikasi ketersediaan dan kecukupan data 


Data dari masing-masing sumber perlu ditelaah dan belum dapat langsung dipakai karena.

Select one:

a. Maksud dan tujuan data sama

b. Tingkat keandalan (reliability) data sama 

c. Tingkat kekayaan (richness) data sama 

 d. Data dalam Keadaan asal terpisah-pisah atau justru terintegrasi secara ketat


Visualisasi Statistik dapat disajikan dengan, kecuali..

Select one: 

a. Anova 

b. Scatter Plot 

c. Descriptive Analysis 

 d. Histogram 


Langkah yang dilakukan setelah melakukan telaah data adalah.. 

Select one: 

a. Memodelkan data 

b. Deployment 

c. Mempersiapkan data 

d. Mengevaluasi data 


Pada tahap telaah data, jika definisi permasalahan bisnis masih perlu direvisi maka.. 

Select one: 

 a. Memodelkan data 

 b. Kembali ke business understanding 

c. Mengumpulkan data 

 d. Dilanjutkan ke persiapaan data 


Minggu 7

Secara garis besar, pendekatan penyelesaian masalah berbasis machine learning dapat dibagi menjadi dua yaitu pendekatan supervised dan unsupervised learning. 

Select one: 

True

False 


Dataset yang digunakan pada algoritma supervised learning, sudah memiliki informasi mengenai kategori kelas (label) dari masalah yang ingin diselesaikan. 

Select one: 

True 

False


Sebuah sistem yang mampu menyelesaikan permasalahan berdasarkan inferensi aturan yang didefinisikan dalam program tersebut dapat di kategorikan sebagai salah satu implementasi machine learning. 

Select one: 

True 

False 


Clustering merupakan salah satu contoh permasalahan dengan pendekatan unsupervised learning Select one: 

True 

False 


Label atau Ground Truth pada dataset superbised dapat dibuat oleh siapa saja.

Select one:

True

False


Minggu 8

Berikut adalah metrik evaluasi yang biasa digunakan untuk mengukur kehandalan model machine learning, kecuali 

Select one: 

 a. Accuracy 

 b. Recall 

 c. p-value

d. F1-score  


Nilai korelasi pada koefisien korelasi pearson bernilai ... jika kedua variabel yang diuji memiliki hubungan yang bertolak belakang 

 Select one: 

 a. positif 

 b. decimal 

 c. negatif 

d. 0 


Proses perubahan data berjenis kategori menjadi suatu bilangan biner merupakan definisi proses ... Select one: 

 a. encoding 

b. enkripsi 

c. dicoding 

 d. dekripsi 


Perintah .describe(includez-all) akan memberikan hasil deskripsi statistik untuk data yang bernilai numerik dan obyek 

 Select one: 

 True 

False 


Anda membutuhkan dataset yang telah dilabelkan oleh expert (ground truth) untuk menggunakan algoritma dengan jenis supervised learning. 

Select one: 

True

False 


Soal Komputasi Big Data Minggu Ke-3 - Universitas Gunadarma

Jawaban ada pada pilihan ganda yang dibold


Properti Big data yang penting, salah satunya adalah fault tolerance, yaitu:

Select one:

a. Handal

b. Ketersediaan layanan secara terus menerus

c. Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja

d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen


Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik kecuali:

Select one:

a. Inconsistent dan uncertaint

b. Terakumulasi dengan cepat (high speed velocity)

c. Volume besar, struktur data yang beragam (variety), dan nilai data yang diperlukan (useful value)

d. Jumlah fitur yang tertentu


Properti Big data yang penting, salah satunya adalah scalability, yaitu:

Select one:

a. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen

b. Handal

c. Ketersediaan layanan secara terus menerus

d. Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja


Pemrosesan data terdistribusi adalah pemrosesan

Select one:

a. yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu cluster

b. yang melibatkan pelaksanaan sub-tugas secara bersamaan secara kolektif membentuk tugas yang besar melalui beberapa processor

c. yang menggunakan pendekatan pendekatan interaktif tanpa penundaan

d. yang membagi pemrosesan dalam beberapa batch dan dilakukan secara offline


Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok yang umum bekerja bersama Hadoop adalah

Select one:

a. MapReduce, MySQL and Google Apps

b. MapReduce, Hummer and Iguana

c. MapReduce, Heron and Trumpet

d. MapReduce, Hive and Hbase


Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah:

Select one:

a. Menentukan jumlah data dan atribut data

b. Classification analytics, regression analytics, clustering analytics, dan hadooping analytics

c. Descriptive analytics, diagnostic analytics, predictive analytics, dan prescriptive analytics

d. mean statistic analytics, deviation standard analytics, dan percentil analytics


YARN singkatan dari

Select one:

a. Yahoo’s another resource name

b. Yet another resource need

c. Yet another resource negotiator

d. Yahoo’s archived Resource names


Type data berikut yang dapat ditangani oleh Hadoop adalah

Select one:

a. Semua benar

b. Tidak terstuktur

c. Semi – terstruktur

d. Terstruktur


Hadoop adalah framework yang

Select one:

a. Menerapkan programming model yang sederhana

b. Melibatkan satu atau lebih cluster Komputer

c. Memungkinkan pemrosesan secara terdistribusi terhadap data yang berukuran besar

d. Semua benar


Terdapat 2 (dua) teknologi Penyimpanan Big Data, yaitu

Select one:

a. On Disk Storage Devices dan In Memory Storage Devices

b. Reliable dan Fault tolerance

c. SQL dan No-SQL

d. Flashdisk dan harddisk


Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan dengan dataset yang selalu terhubung menjadi lebih mudah dan sering digunakan untuk jaringan media sosial.

Select one:

a. Grafik

b. Pencarian

c. Dokumen

d. Primary key

 

Properti Big data yang penting, salah satunya adalah aviability, yaitu:

Select one:

a. Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja

b. Ketersediaan layanan secara terus menerus

c. Handal

d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen


NoSQl database adalah singkatan dari

Select one:

a. No Like Structured Query Language database

b. Numbered of Structured Query Language database

c. Numbered of sequel database

d. Not-only Structured Query Language database

 

Pernyataan yang benar mengenai MapReduce, adalah:

Select one:

a. implementasi dari framework pemrosesan batch

b. semua benar

c. memproses data besar secara parallel dalam cluster pada commodity hardware

d. membagi masalah besar menjadi masalah kecil yang dapat diselesaikan dengan cepat

 

Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola data. Jenis database ini dioptimalkan secara khusus untuk aplikasi yang memerlukan…., yang dicapai dengan mengurangi pembatasan konsistensi data dari database lainnya.

Select one:

a. volume data besar, latensi rendah, dan model data fleksibel

b. volume data besar, latensi rendah, dan model data fleksibel

c. volume data besar, latensi rendah, dan model data fleksibel

d. volume data besar, latensi rendah, dan model data fleksibel


Komponen layanan inti Hadoop adalah

Select one:

a. Speed, consistency, dan volume

b. SQL, NoSQL, Cluster

c. ClickStream, Sensor, dan Sentiment

d. MapReduce, HDFS, dan YARN

 

Properti Big data yang penting, salah satunya adalah reliability, yaitu:

Select one:

a. Ketersediaan layanan secara terus menerus

b. Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja

c. Handal

d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen


Bagian pekerjaan utama MapReduce adalah

Select one:

a. combine dan partition

b. map dan reduce

c. shuffle dan sort

d. map dan combine

 

Berikut ini yang bukan merupakan Hadoop operation mode, adalah

Select one:

a. Stand alone mode

b. Fully-Distributed mode

c. Pseudo distributed mode

d. Globally distributed mode

 

Sistem penyimpanan data cluster adalah

Select one:

a. Data disimpan dengan cara menyalin dataset dan meyimpan Salinan tersebut pada beberapa node

b. Menyimpan data dengan mempartisi secara horizontal dan pecahan horizontal tersebut di simpan secara terpisah pada node server.

c. Penyimpanan dan pengaturan data pada perangkat penyimpanan harddisk atau flashdisk, dan menyediakan logical view dari data yang disimpan dalam struktur hirakis direktori file.

d. Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang sama. Serta terhubung melalui jaringan dan bekerja sebagai satu kesatuan

Pre Test Praktikum Komputasi Big Data

Pre Test Minggu 1 Sebuah nilai yang menggambarkan keeratan hubungan atau nilai kekuatan hubungan dan arah hubungan dari dua variabel disebu...