Kamis, 07 Juli 2016

CATEGORY ANALYSIS ON ISLAMIC FINANCE LITERATURE



Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. 

Sementara itu text mining memiliki definisi mengolah data yang berupa teks dimana sumber data biasanya di dapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antardokumen. 

Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks (text categorization) dan pengelompokan teks (text clustering).

Kali ini SMART mencoba melakukan riset terkait penelusuran literatur keuangan Islam berupa buku bertema "Islamic Finance" di seluruh dunia. Yang menjadi objek data terpilih 50 buku Islamic Finance dengan tools Semantria sebagai alat bantu olah data. Ke-50 buku tersebut terutama diambil abstraksi/summary-nya dari portal penjualan buku terbesar, amazon.com.

Hasilnya tampak pada gambar di bawah. Dari seluruh objek buku bertema Islamic Finance, tersarikan menjadi beberapa kategori yakni: Business, Finance, Education, Accounting, Law, Mathematics, Research, IT dan Politics. Dari seluruh kategori tersebut, ada 2 yang dominan yaitu: Business (50%) dan Finance (42%). Sisanya adalah kategori yang lain.

Untuk kedua kategori yang dominan, term Business memiliki category strength antara 0.632 hingga 1.000. Artinya memiliki kekuatan kategorisasi yang kuat. Demikian pula dengan term Finance yang memiliki category strength antara 0.631 hingga 1.000, sedikit di bawah kategori Business. Sementara itu term lain seperti Education, Accounting, Law, Mathematics, Research, IT dan Politics hanya memiliki nilai category strength di bawah 0.553. Jauh lebih rendah dibanding 2 term awal (Business dan Finance).

Untuk kategori Business, terbagi lagi ke dalam sub kategori: Markets, Market trends, Behavioral finance, Financial risk, Cash flow, Basic financial concepts, Distributors, Economic sectors, Inflation, Interest, Macroeconomics dan Product management.

Sementara itu kategori Finance terbagi ke dalam sub kategori: Financial regulatory authorities, Cooperative banking, Private equity secondary market, Bank regulation, Sovereign wealth funds, Bank failures, Banking technology, Ethical banking. 

Penggunaan Semantria dalam text mining ini dapat digunakan untuk berbagai tujuan di antaranya: analisis sentimen, kategorisasi, ekstraksi entitas baik person, perusahaan, produk maupun tempat. Selain itu, tools ini juga dapat digunakan untuk intention analysis dan tujuan penggunaan analisis teks secara umum.

Tidak ada komentar:

Posting Komentar