Rabu, 27 Juli 2016

TEXT ANALYTICS ATAS LITERATUR ZAKAT


Potensi zakat Indonesia dalam setahun mencapai Rp 217 triliun (versi lain mencapai Rp 286 triliun). Tapi realisasinya saat ini menurut riset SMART Consulting baru terhimpun sekitar 1,3 persen saja. Faktanya, dalam 20 tahun terakhir perkembangan lembaga amil zakat di Indonesia berkembang cukup pesat. Namun di sisi lain, jumlah penduduk miskin dan kaum dhuafa di Indonesia justru terus bertambah.
Zakat memang unik. Ia sekaligus memiliki 3 dimensi ibadah. Personal, sosial dan ekonomi. Pertama, dimensi spiritual personal. Zakat merupakan perwujudan keimanan kepada Allah SWT sekaligus sebagai instrumen untuk purifikasi dan penyucian jiwa dari segala penyakit ruhani, seperti bakhil dan tidak peduli sesama.

Kedua adalah dimensi sosial, dimana zakat berorientasi pada upaya untuk menciptakan harmonisasi kondisi sosial masyarakat. Hubungan antara muzakki dan mustahik lebih terjaga. Miskin dan kaya diharapkan tidak terlalu timpang perbedaannya. Melalui zakat, hal itu sangat mungkin dicapai dan direalisasikan.
Yang ketiga adalah dimensi ekonomi, yang tercermin pada dua konsep utama, yaitu pertumbuhan ekonomi berkeadilan (QS 30:39) dan mekanisme sharing dalam perekonomian (QS 51:19). Tujuan utamanya adalah untuk meningkatkan kesejahteraan kaum dhuafa. Pada jangka pendek, kebutuhan primer mustahik dapat terpenuhi, sementara pada jangka panjang, daya tahan ekonomi mereka akan meningkat, sekaligus menstimulasi pertumbuhan ekonomi.
Berdasarkan hasil riset terkait terma zakat atas 30 dokumen spesifik dengan pendekatan text mining, didapatkan beberapa hasil. Pertama, term zakat berkaitan dengan beberapa kategori dan subkategori. Business (0,368), Health (0,184) dan Labor (0,158) menjadi 3 kategori utama. Sementara kategori berikutnya adalah: International Relation (0,079), IT (0,079), Research (0,079) dan Society (0,053).
Kedua perihal sentiment analysis. Analisis sentimen terhadap kondisi zakat di Indonesia memperlihatkan kondisi berikut. Sebanyak 27% menunjukkan sentimen positif. Demikian pula 27% mengarah kepada sentimen negatif. Sisanya sebesar 46% menunjukkan sentimen yang netral. Meskipun realisasi himpunan dana zakat baru sekitar 1,3 persen dari potensinya, namun trendnya menunjukkan hal yang menggembirakan. Terlihat dari inovasi yang dilakukan OPZ maupun awareness masyarakat muslim yang kian hari kian paham akan pentingnya zakat jika diberdayakan secara optimal.

Kamis, 21 Juli 2016

MENGENAL ISTILAH TEXT MINING


Text mining atau text analytics merupakan sebuah istilah yang mendeskripsikan sebuah teknologi yang mampu menganalisis data teks semi-terstruktur maupun tidak terstruktur, hal inilah yang membedakannya dengan data mining dimana data mining mengolah data yang sifatnya terstruktur. Pada dasarnya, text mining merupakan bidang interdisiplin yang mengacu pada perolehan informasi (information retrieval), data mining, pembelajaran mesin (machine learning), statistik, dan komputasi linguistik (Jiawei, dkk, 2012). 

Secara umum konsep pekerjaan text mining mirip dengan data mining, yaitu penggalian prediktif dan penggalian deskriptif. Text mining mengekstrak indeks numerik yang bermakna dari teks dan kemudian informasi yang terkandung dalam teks akan diakses dengan menggunakan berbagai algoritma data mining (statistik dan machine learning) (Miner et al, 2012).  

Penggunaan dan penelitian mengenai text mining telah banyak mendapat perhatian dan aktif dilakukan seiring dengan semakin banyaknya data teks yang diperoleh dari berbagai jaringan sosial, web, dan aplikasi lainnya. Sebagian besar informasi teks yang disimpan tersebut seperti misalnya artikel berita, makalah, buku, perpustakaan digital, pesan email, blog, dan halaman web. Text mining dapat menganalisis dokumen, mengelompokkan dokumen berdasarkan kata-kata yang terkandung di dalamnya, serta menentukan kesamaan di antara dokumen untuk mengetahui bagaimana mereka berhubungan dengan variabel lainnya (Statsoft, 2015). 

Minggu, 17 Juli 2016

MENGENAL BEBERAPA ANALISIS DALAM TEXT MINING



Melanjutkan hasil riset kemarin terkait text analytics atau text mining, kali ini akan dijelaskan beberapa analisis dalam pendekatan olah kata ini. Sedikitnya ada 5 analisis penting yang dapat digunakan dan dielaborasi. Objek data dalam analisis ini adalah 50 literatur buku terkait keuangan Islam.

Pertama adalah Query Analysis. Query adalah analisa untuk mencari obyek berdasarkan atribut data yang dimiliki. Query analysis adalah proses yang digunakan dalam database yang menggunakan SQL untuk menentukan bagaimana agar lebih mengoptimalkan query untuk kinerja. Hasilnya, dari 50 literatur keuangan Islam, terbagi dalam 3 kelompok. Education sebesar 70%, religion 20% dan business 10%.

Kedua adalah Sentiment Analysis. Analisis sentimen merupakan proses klasifikasi dokumen tekstual ke dalam tiga kategori, yaitu kelas sentimen positif, negatif dan netral. Dari objek data yang diolah, sebanyak 64% memiliki penilaian positif, 28% netral dan hanya 8% yang memiliki sentimen penilaian negatif.

Ketiga adalah Phrases Analysis. Frase adalah sebuah makna linguistik. Lebih tepatnya, frasa merupakan satuan linguistik yang lebih besar dari kata dan lebih kecil dari klausa dan kalimat. Frasa adalah kumpulan kata nonpredikatif. Artinya frasa tidak memiliki predikat dalam strukturnya. Setelah diolah, frase yang paling banyak muncul "Islamic Finance" sebesar 26%. Selanjutnya adalah frase "Islamic Banking" sebesar 6% dan ketiga adalah "Islamic Law" 5%. Sisanya adalah frase-frase lain. 

Keempat adalah Category Analysis. Tujuan dari analisis ini adalah, mengklasifikasi objek data berdasarkan kategori tertentu. Hasilnya seperti yang baru lalu ditampilkan. Business (50%) dan Finance (42%) yang paling dominan dibanding kategori lain seperti: Accounting, IT, Politics etc. 

Last but not least adalah Summary Analysis. Yang terakhir ini mempunyai fungsi dan kegunaan melakukan ekstraksi dari data yang banyak menjadi hanya beberapa kesimpulan penting. Misal, sebuah buku yang terdiri dari ratusan halaman dapat di-ekstrak menjadi hanya 3-4 paragraf yang merupakan kesimpulan dan summary terpenting dari keseluruhan.

Kamis, 07 Juli 2016

CATEGORY ANALYSIS ON ISLAMIC FINANCE LITERATURE



Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. 

Sementara itu text mining memiliki definisi mengolah data yang berupa teks dimana sumber data biasanya di dapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antardokumen. 

Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks (text categorization) dan pengelompokan teks (text clustering).

Kali ini SMART mencoba melakukan riset terkait penelusuran literatur keuangan Islam berupa buku bertema "Islamic Finance" di seluruh dunia. Yang menjadi objek data terpilih 50 buku Islamic Finance dengan tools Semantria sebagai alat bantu olah data. Ke-50 buku tersebut terutama diambil abstraksi/summary-nya dari portal penjualan buku terbesar, amazon.com.

Hasilnya tampak pada gambar di bawah. Dari seluruh objek buku bertema Islamic Finance, tersarikan menjadi beberapa kategori yakni: Business, Finance, Education, Accounting, Law, Mathematics, Research, IT dan Politics. Dari seluruh kategori tersebut, ada 2 yang dominan yaitu: Business (50%) dan Finance (42%). Sisanya adalah kategori yang lain.

Untuk kedua kategori yang dominan, term Business memiliki category strength antara 0.632 hingga 1.000. Artinya memiliki kekuatan kategorisasi yang kuat. Demikian pula dengan term Finance yang memiliki category strength antara 0.631 hingga 1.000, sedikit di bawah kategori Business. Sementara itu term lain seperti Education, Accounting, Law, Mathematics, Research, IT dan Politics hanya memiliki nilai category strength di bawah 0.553. Jauh lebih rendah dibanding 2 term awal (Business dan Finance).

Untuk kategori Business, terbagi lagi ke dalam sub kategori: Markets, Market trends, Behavioral finance, Financial risk, Cash flow, Basic financial concepts, Distributors, Economic sectors, Inflation, Interest, Macroeconomics dan Product management.

Sementara itu kategori Finance terbagi ke dalam sub kategori: Financial regulatory authorities, Cooperative banking, Private equity secondary market, Bank regulation, Sovereign wealth funds, Bank failures, Banking technology, Ethical banking. 

Penggunaan Semantria dalam text mining ini dapat digunakan untuk berbagai tujuan di antaranya: analisis sentimen, kategorisasi, ekstraksi entitas baik person, perusahaan, produk maupun tempat. Selain itu, tools ini juga dapat digunakan untuk intention analysis dan tujuan penggunaan analisis teks secara umum.

Jumat, 01 Juli 2016

SENTIMENT ANALYSIS BANK SYARIAH INDONESIA: PENDEKATAN TEXT ANALYTICS



Sentiment Analysis merupakan sebuah cabang penelitian pada domain Text Mining yang mulai booming pada awal tahun 2002-an. Risetnya mulai marak semenjak paper dari B.Pang dan L.Lee muncul. Sederhananya, text mining lebih bertujuan untuk mengolah kata, bukan mengolah angka.

Sentiment analysis terdiri dari 3 subproses besar yakni:
Subjectivity Classification, Orientation Detection dan Opinion Holder & Target Detection. Hingga saat ini, hampir sebagian besar penelitian di bidang sentiment analysis ditujukan untuk Bahasa Inggris karena memang Tools/Resources untuk bahasa inggris sangat banyak sekali. Beberapa resources yang sering digunakan untuk sentiment analysis adalah SentiWordNet dan WordNet.

SMART Consulting mencoba mengukur tingkat sentimen publik terhadap bank syariah di Indonesia. Terutama juga dikaitkan dengan komparasi terhadap perkembangan bank syariah di negara tetangga, Malaysia. Dipilih 20 dokumen yang digunakan sebagai sumber data. Tools Semantria digunakan sebagai alat bantu.

Hasilnya menunjukkan bahwa dari data yang ada, hanya 30% dokumen yang memiliki sentimen positif atas perkembangan bank syariah di Indonesia. Sementara itu, 35% dokumen bersentimen negatif. Sisanya, yakni sebesar 35% lebih mengarah pada penilaian netral. 

Merujuk hasil ini, pada faktanya, sentimen negatif lebih dominan dibanding dengan sentimen positif atas perkembangan industri bank syariah di Indonesia. Tentu saja banyak alasan yang mendasarinya: Kekurangan SDM syariah yang handal, persepsi masyarakat yang kurang baik, hingga regulasi yang kurang mendukung dibanding yang dilakukan otoritas yang sama di negeri jiran.