Koleksi Pustaka
Dunia keberitaan diramaikan setiap detiknya dengan berita-berita yang masuk dari berbagai sumber berita, seperti portal berita online, yang mengeluarkan berbagai jenis berita. Ditjen Aptika dengan tugas pokoknya memiliki salah satu tugas yaitu mengkaji konten berita di bidang Teknologi Informasi (TI) yang dikelompokkan menjadi beberapa kategori. Telah banyak penelitian yang dilakukan untuk mempermudah pelaksanaan pengkategorian teks dengan menerapkan machine learning, dan kebanyakan penelitian menghasilkan akurasi klasifikasi tertinggi dengan algoritma Support Vector Machine dan Naive Bayes. Penelitian ini menghasilkan sistem klasifikasi berita TI berbasis website yang sudah bekerja sesuai dengan ekspektasi perilaku aplikasi yang diharapkan. Klasifikasi berhasil dilakukan dengan menggunakan 2 buah model, yaitu model pertama untuk klasifikasi berita TI dan model kedua untuk klasifikasi kategori TI. Hasil evaluasi kinerja model klasifikasi berita TI dengan algoritma Support Vector Machine adalah model pertama menghasilkan nilai precision 99.21%, recall 95.49% dan akurasi 97.37%; dan model kedua menghasilkan nilai akurasi 80% dan macro F1 78.22%.