bang saya mau nanya nih masih bingung pas labelingnya.. apakah target/output harus selalu 1 dimensi ?? terus kalo features/input harus selalu 2 dimensi bang??
@belajaridn
3 жыл бұрын
Betul, sekumpulan nilai features selalu ditampung dalam numpy array 2 dimensi sedangkan sekumpulan nilai target selalu ditampung dalam numpy array 1 dimensi.
@cseptian
3 жыл бұрын
@@belajaridn baik terimakasih banyak bang.. sukses selalu
@belajaridn
3 жыл бұрын
Sama-sama, terima kasih untuk pertanyaan nya juga. Ini juga bakal ditanya mahasiswa saya di kampus juga :)
@hadipurnomosoetanto8036
2 жыл бұрын
Penjelasan memang cukup sederhana. Tapi yang perlu diperhatikan adalah. Cara menganalisa nilai2 evaluasi akurasi, precision, recall, f1_score, mcc. Apa manfaat dan implikasinya bila score yg didapatkan dg nilai tertentu.
@belajaridn
2 жыл бұрын
Terima kasih untuk masukannya 😊🙏
@TryCatchDev
3 жыл бұрын
Thank you bang. Akhirnya ngerti konsep nya.
@belajaridn
3 жыл бұрын
Sama-sama, senang bisa membantu 😊☕🙏
@saaddinnursaid1543
Жыл бұрын
Pak, saya sudah nonton sampai sejauh ini dan sangat membantu & clear penjelasannya, mohon untuk dilanjutkan terus setelah sesi 16, untuk materi Machine Learning yang lebih advance dan penerapannya, terimakasih...
@belajaridn
Жыл бұрын
Baik, tapi belum bisa dalam waktu dekat mengingat load pekerjaan saya yang cukup tinggi sekarang ini 😅🙏
@saaddinnursaid1543
Жыл бұрын
@@belajaridn siap Pak.... semangat terus, mungkin minta rekomendasinya setelah menamatkan sesi ini saya harus belajar kemana lagi untuk materi lanjutannya ya?
@belajaridn
Жыл бұрын
Saya sangat merekomendasikan untuk ambil beberapa kelas di Coursera.
@dadan.dahman.w
3 жыл бұрын
Mantap, baru bisa nyimak nih
@belajaridn
3 жыл бұрын
Semoga bermanfaat ya. KNN untuk regression task juga sudah tersedia :)
@MrSalmantube100
3 жыл бұрын
penjelasannya sangat lengkap... mantap
@belajaridn
3 жыл бұрын
Terima kasih, memang akan kami pergunakan untuk mengajar di kampus juga. Semnoga bisa bermanfaat bagi banyak orang :)
@saluangja8470
3 жыл бұрын
tutorial mantul banget, mohon pak di bahas selanjutnya model klasifikasi yg sering di pakai di Indonesia C4.5 & Naive Bayes, hehehe...
@belajaridn
3 жыл бұрын
Siap... Bertahap ya.
@harizpratomo6387
3 жыл бұрын
Setuju bgt C4.5 decision tree
@belajaridn
3 жыл бұрын
Siap, bertahap ya. Kami mencoba menyusun materinya agar beginners friendly :)
@kucingganteng3536
2 жыл бұрын
Terima kasih pak, penjelasannya sangat mudah dimengerti, sehat selalu pak🙏
@belajaridn
2 жыл бұрын
Senang bisa membantu 😊☕🙏
@elsaexam1579
2 жыл бұрын
Terima kasih pak untuk ilmu dan tutorialnya sangat lengkap dan rinci. saya masih awam mengenai mechine learning, namun cukup banyak mendapatkan pencerahan dan pemahaman. izin request pak, untuk menambahkan dengan algoritma Neural Network Backpropagation 🙏
@belajaridn
2 жыл бұрын
Sama-sama, senang bisa membantu 😊☕🙏
@abyannaufal167
2 жыл бұрын
wih kereen min , mungkin kalo ada versi jst atau ann sangat membantu
@belajaridn
2 жыл бұрын
Saat ini kami coba fokuskan pada materi dasar machine learning terlebih dahulu 😊☕
@kholidfadhil277
3 жыл бұрын
Mantap! semangat terus bikin videonya!
@belajaridn
3 жыл бұрын
Siap... Materi selanjutnya penerapan KNN pada regression tasks :)
@kholidfadhil277
3 жыл бұрын
@@belajaridn owh siapp betul karena divideo dibilang bisa 22nya ya
@belajaridn
3 жыл бұрын
Betul mas :)
@kartikasepti
3 жыл бұрын
Pak ijin untuk next video penjelasan classification menggunakan xgboost
@belajaridn
3 жыл бұрын
Siap, saat ini saya masih menyiapkan materi terkait AdaBoost. Masih putar otak untuk menjelaskan dengan cara yang sesederhana mungkin.
@yunirere6760
3 жыл бұрын
Kak request tutorial pemprograman menggunakan metode naive bayes dan seleksi fitur information gain kak
@belajaridn
3 жыл бұрын
Bertahap ya, seri belajar ini memang ditujukan untuk memulai perjalanan dalam bidang machine learning :)
@dwirizkiyulianti8524
2 жыл бұрын
Ka, klo data nya berupa image classification yg disimpan di lokal disc. Untuk memasukan ke dataset dalam program bagaimana ya ka?
@ekaagustina9010
3 жыл бұрын
27:52 pak izin bertanya nilai np.array dari X_test dan y_test itukan terdiri dari 4 datapoint ya? Nah 4 datapoint itu terserah dari kita apa gimana pak? Maksudnya jumlah datapoinnya kita yang tentukan sendiri atau gimana pak? Trus nilai2 yg [168, 65], [180, 96 ] dst kita juga yg menetukan sendiri ya pak?
@belajaridn
3 жыл бұрын
Data points untuk materi ajar ini sengaja dibuat kecil agar konsep yang disampaikan bisa dipelajari dengan lebih mudah. Dalam real world scenario, jumlah data points nya bisa ribuan atau bahkan ratusan juta 😊
@andrysistiawan6033
3 жыл бұрын
Sebelumnya saya mengucapkan Terima Kasih atas share ilmunya, Saya ingin bertanya kak, mechine learning itu bisa membuat suggest/saran yang seharusnya kita lakukan setelah pembuatan model? Regards,
@juprisupriadi175
3 жыл бұрын
pak, izin bertanya: jika nilai target nya tidak hanya 2, misal 5. apakah tetap pakai LabelBinarizer? dan pada saat training model, terjadi error "ValueError: Found input variables with inconsistent numbers of samples..." terimakasih sebelumnya pak Budi
@belajaridn
3 жыл бұрын
LabelBinarizer sesuai dengan namanya hanya untuk keperluan target label yang biner (hanya dua nilai). Untuk target label dengan nilai lebih dari dua bisa menggunakan fungsi lain.
@rizkiakbarmubarok7083
2 жыл бұрын
bang ada tutorial knn dengan database sql ngga ya bang klo bisa yg postgre atau yang lain juga gpp..
@belajaridn
2 жыл бұрын
Topik SQL pernah kami bahas juga di channel Indonesia Belajar. Coba cek saja di daftar playlist kami.
@BudiHandarbeniSAtma
3 жыл бұрын
Untuk classification, data target yang seimbang apa sangat mempengaruhi hasil akurasi prediksi?
@belajaridn
3 жыл бұрын
Apakah bisa diperjelas apa yang dimaksud dengan data target yg berimbang di sini?
@garincaesar8003
3 жыл бұрын
bang mau tanya di menit 17:40.. reshapenya kalo lebih dari 2 gimana ya?? itu kan pria dan wanita sedangkan data saya tentang agama, agama di data saya ada 7
@belajaridn
3 жыл бұрын
Array pada menit tersebut perlu direshape karena hanya terdiri dari satu baris saja, sehingga array yg terbentuk adalah array 1D, padahal Scikit Learn membutuhkan sekumpulan nilai features dalam format array 2D.
@RayfordR-p3v
Жыл бұрын
Pak izin bertanya, untuk model evaluasi, apa bedanya menggunakan r2_squared dengan accuracy_score
@anakagung7613
3 жыл бұрын
Buset, tutorial gratis. Ada rencana bikin kelas khusus tutorial berbayar gak mas?
@belajaridn
3 жыл бұрын
Sementara belum ada rencana mas. He3 masih mengandalkan donasi saja :)
@lareosing2000
Жыл бұрын
bang saya mau nanya bagaimana untuk mendeteksi data berikutnya adalah data anomali
@bahrenLM
2 жыл бұрын
Bang boleh kah kasih demo untuk menggunakan K-NN untuk Image Classification, Butuh bantuan untuk tugas kuliah
@sinyomnoer4632
2 жыл бұрын
maaf, mau nanya, kalau klasifikasi fingerprint dengan KKN, bisa nggak, atau dengan library yg lain
@belajaridn
2 жыл бұрын
Bisa dicoba sih mas. Perlu didefinisikan terlebih dahulu feature set nya dan juga target label nya 😊☕
@darwinvironomy3538
2 жыл бұрын
apa KNN bisa menjadi model yang berperan sama untuk membangun garis lurus sama seperti LinearRegression?
@belajaridn
2 жыл бұрын
KNN tidak menggunakan persamaan garis dalam melakukan prediksi, melainkan memanfaatkan nilai dari sejumlah data points terdekat (neighbours).
@darwinvironomy3538
2 жыл бұрын
@@belajaridn terimakasih atas jawabannya.
@belajaridn
2 жыл бұрын
Sama-sama, semoga membantu ya 😊🙏
@davidcarbon8467
2 жыл бұрын
Kak mau tanya, kalo metode KNN ini cocok buat regresi juga kah? Biasanya regresi itu berkaitan dengan prediksi harga, cuaca, gaji
@belajaridn
2 жыл бұрын
KNN juga bisa diterapkan untuk regresi. Terkait efektifitas, tentunya akan sangat bergantung pada karakteristik dari dataset yang kita miliki 😊☕
@agpri9056
3 жыл бұрын
Misalkan untuk contoh kasus (tinggi, berat, jk) ditambah sebuah feature (parameter) yaitu usia, bagaimana caranya KNN dapat digunakan untuk memprediksi tinggi badan maksimum seseorang ? Terimakasih.
@belajaridn
3 жыл бұрын
Untuk prediksi tinggi badan akan termasuk dalam regression task. Materi berikutnya akan membahas topik ini :) Saat ini materi sedang masuk tahap verifikasi untuk memastikan tidak terdapat kesahalan yang berpotensi menyesatkan :D
@belajaridn
3 жыл бұрын
Kalau terkait perhitungan distance, Euclidean Distance bisa menangani lebih dari satu features :) Hanya saja untuk contoh di sini kita awali dengan dua features dulu.
@Delianur
3 жыл бұрын
Izin tanya Pak Budi... Saya belum memperhatikan video tutorial di Pytonic Way atau struktur data Python seperti yang disarankan Pak Budi. Tapi apakah pungsi print(f'') ada penjelasannya di kedua video tersebut?Terima kasih sebelumnya Pak Budi
@belajaridn
3 жыл бұрын
Ini terkait f string, salah satu teknik pemformatan string di Python. Penjelasan detailnya ada di salah satu video dalam playlist Pythonic 😊☕
@Delianur
3 жыл бұрын
@@belajaridn siaaap
@adamrain3091
2 жыл бұрын
Pak mau tanya, Kenapa waktu preprocessing data ketika coding nya " xtrain = np.array(sensus_df[['berat', 'tinggi',]]) " terus dilanjutkan prediksi dengan tinggi 155 ; berat badan = 70 hasilnya jadi pria Tapi, ketika code diatas saya sesuaikan dengan coding bapak yang ini " X_train = np.array(sensus_df[['tinggi', 'berat']]) " dengan prediksi tinggi dan berat badan sama hasilnya menjadi wanita Apakah posisi feature berpengaruh saat preprocessing seperti coding diatas Mohon pencerahanya pak Terima kasih 🙏🙏🙏🙏
@laduanuma
2 жыл бұрын
Izin bertanya, Pak. Dari contoh dataset iris, ada total 150 data, 3 data-target/label. Nah dari 150 data itu, jumlah data untuk setiap label itu seimbang (50 data per label) dan akurasinya didapat diatas 80%. Misalkan kita mengumpulkan data sendiri, tetapi jumlah data untuk setiap label tidak berimbang, apa akan memengaruhi tingkat akurasinya? Jika iya, bagaimana solusinya kira-kira, ya, Pak? Terima kasih sebelumnya, Pak.
@akhmadhilmy979
3 жыл бұрын
mas mau nanya dong,kan MCC untuk test performa binary classifier, dalam kasus ku classifiernya ada 3, jadi nggak aku transform ke binary untuk kasus seperti itu apa bisa ya?
@fuadzulzakimuhammad7482
Жыл бұрын
Bang kalau error: No module name scipy.partial solusinya gimana bang? padahal udah di uninstall/install&upgrade terbaru package scipynya
@alfiyantokondolele7317
3 жыл бұрын
Pak apakah ada sumber bacaan di internet untuk cara membaca hasil dari evaluasi untuk model ML dari setiap fungsi yang digunakan? Selain dari Scikitlearn.
@belajaridn
3 жыл бұрын
Saya sangat merekomendasikan buku ini: themlbook.com/
@melinuxid
3 жыл бұрын
sepertinya cocok buat modeling karakter pasien ini ya pak..
@melinuxid
3 жыл бұрын
....ayo kalau mau ikut riset....😁😁😁😁
@melinuxid
3 жыл бұрын
indonesia belajar .. di sistem saya tercatat historikal pasien..baik quantitatif maupun kualitatif... jadi scara logika bisa kita lihat kecendrungan pasien akan masuk ke kelompok pasien penyakit x atau y dst..inincontoh aja..dan bisa dilihat kecendrungan pemakaian obatnya apa...bisa dihubungkan ke perencanaan stok obat..demografi..dll...imajinasi aja batasannya
@melinuxid
3 жыл бұрын
@@belajaridn ok p saya coba klik..maklum lah..saya agak gaptek sosmed.......😁😁😁... pas paparan materi ibu inggriani di bukalapak itu terkesan saya. istilah computational thinking....saya sendiri mmg cmn lulusan teknik mesin tapi mmg hobi komputer otodidak sejak smp kelas 1 ..dan..amaze juga ternyata belia pengguna LOGO dengan Turtle nya ...wkwkwk..programming saya pertama itu dan juga applesoft basic......pake Apple ][ e taon 85 ..😂😂...
@farahhasna7808
3 жыл бұрын
kak untuk penentuan nilai k nya ini apakah terserah kita atau ada metode khusus untuk menentukan nilai k nya kak? Soalnya bisa jadi setiap orang akan memilih nilai k yang berbeda2 Terima kasih kak
@belajaridn
3 жыл бұрын
Penentuan nilai K ini sifatnya arbritary atau kita yang menentukan. Tentunya dengan melihat ketersediaan data.
@unggulprabowo1045
3 жыл бұрын
Mas, kalau untuk prediksi jumlah wisatawan ataupun hasil keuntungan objek wisata. Pakai data apa saja yak ?,.
@belajaridn
3 жыл бұрын
Tentunya menggunakan dataset terkait wisata mas :)
@hanssss13
3 жыл бұрын
bang, nilai target apakah selalu 2 nilai saja? apakah semisal nilainya tidak teratur seperti data berupa (1,2,3,4,5.....,x) bisa dijadikan sebagai nilai target?
@belajaridn
3 жыл бұрын
Nilai target class nya tidak mesti dua mas, bisa juga lebih dari dua class ☺️☕🙏 Untuk kasus yang memang hanya memiliki dua class saja dikenal dengan istilah binary classification.
@hanssss13
3 жыл бұрын
@@belajaridn kalau pakai lebih dari 2 bisa pakai apa ya bang? aku coba pakai label encoder di nilai target malah muncul "too many indices for array: array is 1-dimensional, but 2 were indexed". mohon pencerahannya bang😅
@belajaridn
3 жыл бұрын
Mestinya bisa mas. Coba cek lagi nilai parameter nya, apakah sudah oke semua?
@lathifahhanum3794
2 жыл бұрын
Kak, bagaimana me-visualisasi data jika data features-nya lebih dari dua? Apa bisa?
@belajaridn
2 жыл бұрын
Bisa, tetapi tentunya dengan jenis visualisasi yang sesuai. Di channel Indonesia Belajar ini kami juga menawarkan satu seri pembelajaran khusus yang membahas topik visualisasi data dengan Matplotlib. Semoga bisa bermanfaat 😊☕🙏
@lathifahhanum3794
2 жыл бұрын
@@belajaridn Baik Kak. Terima kasih, ilmunya sangat bermanfaat ...
@belajaridn
2 жыл бұрын
@@lathifahhanum3794 Sama-sama, senang bisa membantu 😊☕🙏
@jessenjie6202
Жыл бұрын
kak saya ingin bertanya bagaimana jika label tidak hanya dua selain pria dan wanita?, jadi kategori lebih dari 2
@jessenjie6202
Жыл бұрын
sedangkan untuk multiclass/label classification bagaimana ya kak?
@riskadwiayulestari9883
2 жыл бұрын
bagaimana jika menggunakan dataset (exel/csv) pak? apakah codingannya sama? kalau misalnya beda, bedanya dibagian apa?🙏
@belajaridn
2 жыл бұрын
Kita bila load terlebih dahulu dataset nya ke dalam Pandas Dataframe. Di channel Indonesia Belajar ini kami juga menawarkan satu seri pembelajaran khusus yang membahas Pandas Dataframe.
@riskadwiayulestari9883
2 жыл бұрын
kalau untuk data testingnya diperoleh dari mana nggih pak? kok berbeda dengan data yg sudah ada(data training?
@ichsanpradana9292
2 жыл бұрын
Pak, jika KNN diterapkan pada dataset dengan kelas tidak seimbang, apakah akan menurunkan performanya?
@ardr1111
3 жыл бұрын
Saya masih bingung sama konsep ML.. Misal kita udh dpt akurasi yg bagus.. terus whats next?? Gimna cara aplikasi in algoritma tersebut?
@belajaridn
3 жыл бұрын
Setelah modelnya kita training, maka model tersebut bisa kita deploy di production. Kebetulan kami pernah mengundang seorang machine learning engineer dari Gojek untuk berbagi insight terkait ini pada salah satu sesi podcast Indonesia Belajar. Semoga bisa membantu :)
@ardr1111
3 жыл бұрын
Makasih kak, akhirnya.. menemukan jalan..
@belajaridn
3 жыл бұрын
Besok kami juga merilis sesi podcast bersama seorang Machine Learning Engineer dari Google Singapore untuk bahas topik ML Ops. Ini juga sangat terkait dengan pertanyaanmu tadi 😊☕
@jefry4887
Жыл бұрын
Pak apakah data mining dan machine learning masih berhubungan? Soalnya saya lagi bljr data mining tapi kok di machine learning ada juga materinya ya? Sperti regresi linier, euclidean dll?
@belajaridn
Жыл бұрын
Sangat erat mas hubungannya. Sebagian besar teknik dalam data mining juga berada dalam lingkup Machine Learning.
@farhanramadhan5924
2 жыл бұрын
Saya punya pertanyaan Pak, saat prediksi jenis kelamin, saat saya melakukan lb.inverse_transform(y_new), outputnya tetap array([1]), tetapi di tutorial bapak nilainya berubah menjadi menjadi array(['wanita']). Kok saya gak berubah ya pak?
@belajaridn
2 жыл бұрын
Coba ditelusuri lagi mas code nya. Mesti ada kekeliruan :)
@farhanramadhan5924
2 жыл бұрын
@@belajaridn iya, ada kekeliruan di saya, terimakasih ya Pak
@belajaridn
2 жыл бұрын
@@farhanramadhan5924 Sama-sama mas, terus semangat belajar ya :)
@farhanramadhan5924
2 жыл бұрын
@@belajaridn Siap Pak. Sekarang sedang belajar yang Machine learning video ke tujuh
@cseptian
3 жыл бұрын
bang bisa jelaskan apa bedanya reshape(1, -1) dengan reshape(-1, 1) ?? saya masih bingung ini mohon pencerahannya
@belajaridn
3 жыл бұрын
Pertanyaan bagus yang jawaban membutuhan pengetahuan dasar seputar numpy array. Kami cukup kesulitan untuk menjawab melalui komentar, untuk itu kami akan coba buatkan satu video singkat untuk menjawab pertanyaan ini.
@sabdanormanhayat792
2 жыл бұрын
@@belajaridn link video apakah ada pak?
@belajaridn
2 жыл бұрын
Kebetulan belum saya buatkan videonya 🙏
@sonnyilham309
Жыл бұрын
2:36
@izzansilmiaziz
3 жыл бұрын
Saya ingin bertanya kenapa evaluasi modelnya tidak ada menggunakan r2 (R squares) ?
@belajaridn
3 жыл бұрын
Di sini perlu dipahami dulu perbedaan antara classification task dan regression task. Cara melakukan evaluasi pada kedua task tersebut tentunya berbeda.
@izzansilmiaziz
3 жыл бұрын
@@belajaridn Bukannya sama-sama supervised learning ya pak lalu apa yang membedakan ?
@belajaridn
3 жыл бұрын
Seharusnya sudah pernah kami jelaskan di video pertama terkait topik pengenalan Machine Learning mengenai perbedaan Regression dan Classification.
@izzansilmiaziz
3 жыл бұрын
@@belajaridn ya pak coba saya dengarkan ulang
@izzansilmiaziz
3 жыл бұрын
@@belajaridn setelah saya putar ulang saya mulai paham pak. Klasifikasi itu variabel labelnya harus kategori. Namun yang saya ambigu regresi variabel labelnya harus berupa floating point. Nah floating point ini yang bikin agak membingungkan bisa dijelaskan pak apa maksudnya ? Terima kasih.
@linalala292
2 жыл бұрын
Bang kalau import file .csv gimana ya?
@belajaridn
2 жыл бұрын
Kami pernah jelaskan ini di playlist Pandas Data Frame. Coba cek playlist nya saja. Sebenarnya sebelum mempelajari Scikit Learn, kami selalu merekomendasikan untuk belajar Python Pandas terlebih dahulu 😊🙏
@linalala292
2 жыл бұрын
@@belajaridn Oke makasih ya bang
@belajaridn
2 жыл бұрын
Sama-sama 😊🙏
@kholilahqultsum9777
3 жыл бұрын
Kak saya belum mengerti bagaimana cara menentukan nilai K? Dapat nilai 3 dari mana?
@belajaridn
3 жыл бұрын
Jumlah neighbors akan bergantung pada data yang kita miliki. Lebih banyak neighbors tentunya akan membantu performa prediksi. Hanya saja, jumlah neighbors yang terlalu banyak juga dapat menurunkan performa. Di sini dibutuhkan experimentation dan familiarity dengan dataset yang kita miliki.
@kholilahqultsum9777
3 жыл бұрын
@@belajaridn Baik kak, terima kasih penjelasannya
@belajaridn
3 жыл бұрын
Sama-sama, coba simak juga beberapa sesi podcast seputar data science yang ada di channel Indonesia Belajar ini untuk mendapatkan gambaran yang lebih baik terkait data science di industri 😊☕
@yusran9506
Жыл бұрын
Apakah datasetnya bisa file.sql ?
@belajaridn
Жыл бұрын
Sumber datasetnya bisa beragam, bisa csv, xls, sql, parquet, dan banyak lagi.
@daffaafdiansyah9449
2 жыл бұрын
masi gangerti maksdnya 'tetangga' itu apa ? :(
@belajaridn
2 жыл бұрын
Tetangga dalam konteks ini adalah data points yang posisinya berdekatan dengan data point of interest (yang sedang diamati).
Пікірлер: 143