Senin, 17 Oktober 2016

7 BIDANG APLIKASI TEXT MINING


Dikarenakan kebanyakan informasi (perkiraan umum mengatakan lebih dari 80%) saat ini disimpan sebagai teks, text mining diyakini memiliki potensi nilai komersial tinggi (Bridge, 2011). Saat ini, text mining telah mendapat perhatian dalam berbagai bidang: 

Pertama, Aplikasi keamanan. Banyak paket perangkat lunak text mining dipasarkan terhadap aplikasi keamanan, khususnya analisis plain text seperti berita internet. Hal ini juga mencakup studi enkripsi teks. Kedua, Aplikasi biomedis. Berbagai aplikasi text mining dalam literatur biomedis telah disusun. Salah satu contohnya adalah PubGene yang mengkombinasikan text mining biomedis dengan visualisasi jaringan sebagai sebuah layanan Internet. Contoh lain text mining adalah GoPubMed.org. Kesamaan semantik juga telah digunakan oleh sistem text mining, yaitu, GOAnnotator.

Ketiga, Perangkat Lunak dan Aplikasi. Departemen riset dan pengembangan perusahaan besar, termasuk IBM dan Microsoft, sedang meneliti teknik text mining dan mengembangkan program untuk lebih mengotomatisasi proses pertambangan dan analisis. Perangkat lunak text mining juga sedang diteliti oleh perusahaan yang berbeda yang bekerja di bidang pencarian dan pengindeksan secara umum sebagai cara untuk meningkatkan performansinya.

Keempat, Aplikasi Media Online. Text mining sedang digunakan oleh perusahaan media besar, seperti perusahaan Tribune, untuk menghilangkan ambigu informasi dan untuk memberikan pembaca dengan pengalaman pencarian yang lebih baik, yang meningkatkan loyalitas pada site dan pendapatan. Selain itu, editor diuntungkan dengan mampu berbagi, mengasosiasi dan properti paket berita, secara signifikan meningkatkan peluang untuk menguangkan konten. 

Kelima, Aplikasi Pemasaran. Text mining juga mulai digunakan dalam pemasaran, lebih spesifik dalam analisis manajemen hubungan pelanggan. Coussement dan Van den Poel (2008) menerapkannya untuk meningkatkan model analisis prediksi untuk churn pelanggan (pengurangan pelanggan). Keenam, Sentiment Analysis. Sentiment Analysis mungkin melibatkan analisis dari review film untuk memperkirakan berapa baik review untuk sebuah film. Analisis semacam ini mungkin memerlukan kumpulan data berlabel atau label dari efektifitas kata-kata. Sebuah sumber daya untuk efektivitas kata-kata telah dibuat untuk WordNet.

Terakhir adalah Aplikasi Akademik. Masalah text mining penting bagi penerbit yang memiliki database besar untuk mendapatkan informasi yang memerlukan pengindeksan untuk pencarian. Hal ini terutama berlaku dalam ilmu sains, di mana informasi yang sangat spesifik sering terkandung dalam teks tertulis. Oleh karena itu, inisiatif telah diambil seperti Nature’s proposal untuk Open Text Mining Interface (OTMI) dan Health’s common Journal Publishing untuk Document Type Definition (DTD) yang akan memberikan isyarat semantik pada mesin untuk menjawab pertanyaan spesifik yang terkandung dalam teks tanpa menghilangkan barrier penerbit untuk akses publik. Sebelumnya, website paling sering menggunakan pencarian berbasis teks, yang hanya menemukan dokumen yang berisi kata-kata atau frase spesifik yang ditentukan oleh pengguna. Sekarang, melalui penggunaan web semantik, text mining dapat menemukan konten berdasarkan makna dan konteks (daripada hanya dengan kata tertentu). Text mining juga digunakan dalam beberapa filter email spam sebagai cara untuk menentukan karakteristik pesan yang mungkin berupa iklan atau materi yang tidak diinginkan lainnya.

OPINION MINING DAN TEXT ANALYTICS


Analisis sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen dilakukan untuk melihat pendapat atau kecenderungan opini terhadap sebuah masalah atau objek oleh seseorang, apakah cenderung berpandangan atau beropini negatif atau positif. Salah satu contoh penggunaan analisis sentimen dalam dunia nyata adalah identifikasi kecenderungan pasar dan opini pasar terhadap suatu objek barang. Besarnya pengaruh dan manfaat dari analisis sentimen menyebabkan penelitian dan aplikasi berbasis analisis sentimen berkembang pesat. Bahkan di Amerika terdapat sekitar 20-30 perusahaan yang memfokuskan pada layanan analisis sentimen.

Analisis sentimen atau opinion mining adalah studi komputasional dari opini-opini orang, appraisal dan emosi melalui entitas, event dan atribut yang dimiliki (Biu, L. 2010). Tugas dasar dalam analisis sentimen adalah mengelompokkan polaritas dari teks yang ada dalam dokumen, kalimat, atau fitur/tingkat aspek - apakah pendapat yang dikemukakan dalam dokumen, kalimat atau fitur entitas / aspek bersifat positif, negatif atau netral (Dehaff, M., 2010).

Text mining, mengacu pada proses mengambil informasi berkualitas tinggi dari teks. Informasi berkualitas tinggi biasanya diperoleh melalui peramalan pola dan kecenderungan melalui sarana seperti pembelajaran pola statistik. Text mining biasanya melibatkan proses penataan teks input (biasanya parsing, bersama dengan penambahan beberapa fitur linguistik turunan dan penghilangan beberapa diantaranya, dan penyisipan subsequent ke dalam database), menentukan pola dalam data terstruktur, dan akhirnya mengevaluasi dan menginterpretasi output. 'Berkualitas tinggi' di bidang text mining biasanya mengacu ke beberapa kombinasi relevansi, kebaruan, dan interestingness. Proses text mining yang khas meliputi kategorisasi teks, text clustering, ekstraksi konsep/entitas, produksi taksonomi granular, sentiment analysis, penyimpulan dokumen, dan pemodelan relasi entitas (yaitu, pembelajaran hubungan antara entitas bernama) (Wikipedia, 2011).

Rabu, 21 September 2016

7 PRAKTIK TEXT MINING


Aplikasi yang paling umum dilakukan text mining saat ini misalnya penyaringan spam, analisis sentimen, mengukur preferensi pelanggan, meringkas dokumen, pengelompokan topik penelitian, dan banyak lainnya. Menurut Miner et al (2012), pekerjaan text mining dikelompokkan menjadi 7 daerah praktek:

Pencarian dan perolehan informasi (search and information retrieval), yaitu penyimpanan dan penggalian dokumen teks misalnya dalam mesin pencarian (search engine) dan pencarian kata kunci (keywords)
Pengelompokan dokumen, yaitu pengelompokan dan pengkategorian kata, istilah, paragraf, atau dokumen dengan menggunakan metode klaster (clustering) data mining.
Klasifikasi dokumen, yaitu pengelompokan dan pengkategorian kata, istilah, paragraf, atau dokumen dengan menggunkan metode klasifikasi (classification) data mining berdasarkan model terlatih yang sudah memiliki label.
Web mining, yaitu penggalian informasi dari internet dengan skala fokus yang spesifik.
Ekstraksi informasi (information extraction), yaitu mengidentifikasi dan mengekstraksi informasi dari data yang sifatnya semi-terstruktur atau tidak terstruktur dan mengubahnya menjadi data yang terstruktur.
Natural language processing (NLP), yaitu pembuatan program yang memiliki kemampuan untuk memahami bahasa manusia.
Ekstraksi konsep, yaitu pengelompokan kata atau frase ke dalam kelompok yang mirip secara semantik.

Rabu, 07 September 2016

EKSTRAKSI DOKUMEN DALAM TEXT MINING


Teks yang akan dilakukan proses text mining, pada umumnya memiliki beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen. Sebelum menentukan fitur-fitur yang mewakili, diperlukan tahap preprocessing yang dilakukan secara umum dalam teks mining pada dokumen, yaitu case folding, tokenizing, filtering, stemming, tagging dan analyzing.

a. Case folding dan Tokenizing. Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf “a” sampai dengan “z” yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter. Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. 

b.Filtering. Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist/stopword adalah kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh stopwords adalah “yang”, “dan”, “di”, “dari”, dan seterusnya. 

c. Stemming. Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata ke dalam suatu representasi yang sama. Tahap ini kebanyakan dipakai untuk teks berbahasa nggris dan lebih sulit diterapkan pada teks berbahasa Indonesia. Hal ini dikarenakan bahasa Indonesia tidak memiliki rumus bentuk baku yang permanen (Eko, 2011). Stemming merupakan suatu proses yang terdapat dalam sistem IR yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke kata-kata akarnya (root word) dengan menggunakan aturan-aturan tertentu. 

Sebagai contoh, kata bersama, kebersamaan, menyamai, akan distem ke root wordnya yaitu “sama”. Proses stemming pada teks berbahasa Indonesia berbeda dengan stemming pada teks berbahasa Inggris. Pada teks berbahasa Inggris, proses yang diperlukan hanya proses menghilangkan sufiks. Sedangkan pada teks berbahasa Indonesia, selain sufiks, prefiks, dan konfiks juga dihilangkan (Ledy, 2009).

Kamis, 01 September 2016

4 TAHAP PROSES TEXT MINING


Ada empat tahap proses pokok dalam text mining, yaitu pemrosesan awal terhadap teks (text preprocessing), transformasi teks (text transformation), pemilihan fitur (feature selection), dan penemuan pola (pattern discovery) (Eko, 2011). 

Pertama, Text Preprocessing. Tahap ini melakukan analisis semantik (kebenaran arti) dan sintaktik (kebenaran susunan) terhadap teks. Tujuan dari pemrosesan awal adalah untuk mempersiapkan teks menjadi data yang akan mengalami pengolahan lebih lanjut. Operasi yang dapat dilakukan pada tahap ini meliputi part-of-speech (PoS) tagging, menghasilkan parse tree untuk tiap-tiap kalimat, dan pembersihan teks. 

Kedua, Text Transformation. Transformasi teks atau pembentukan atribut mengacu pada proses untuk mendapatkan representasi dokumen yang diharapkan. Pendekatan representasi dokumen yang lazim digunakan oleh model “bag of words” dan model ruang vector (vector space model). Transformasi teks sekaligus juga melakukan pengubahan kata-kata ke bentuk dasarnya dan pengurangan dimensi kata di dalam dokumen. Tindakan ini diwujudkan dengan menerapkan stemming dan menghapus stop words.

Ketiga, Feature Selection. Pemilihan fitur (kata) merupakan tahap lanjut dari pengurangan dimensi pada proses transformasi teks. Walaupun tahap sebelumnya sudah melakukan penghapusan katakata yang tidak deskriptif (stopwords), namun tidak semua kata-kata di dalam dokumen memiliki arti penting. Oleh karena itu, untuk mengurangi dimensi, pemilihan hanya dilakukan terhadap kata-kata yang relevan yang benar-benar merepresentasikan isi dari suatu dokumen. Ide dasar dari pemilihan fitur adalah menghapus kata-kata yang kemunculannya di suatu dokumen terlalu sedikit atau terlalu banyak. Algoritma yang digunakan pada text mining, biasanya tidak hanya melakukan perhitungan pada dokumen saja, tetapi juga pada feature.

Keempat, Pattern Discovery. Pattern discovery merupakan tahap penting untuk menemukan pola atau pengetahuan (knowledge) dari keseluruhan teks. Tindakan yang lazim dilakukan pada tahap ini adalah operasi text mining, dan biasanya menggunakan teknik-teknik data mining. Dalam penemuan pola ini, proses text mining dikombinasikan dengan proses-proses data mining. Masukan awal dari proses text mining adalah suatu data teks dan menghasilkan keluaran berupa pola sebagai hasil interpretasi atau evaluasi. Apabila hasil keluaran dari penemuan pola belum sesuai untuk aplikasi, dilanjutkan evaluasi dengan melakukan iterasi ke satu atau beberapa tahap sebelumnya. Sebaliknya, hasil interpretasi merupakan tahap akhir dari proses text mining dan akan disajikan ke pengguna dalam bentuk visual (Eko, 2011).

Selasa, 16 Agustus 2016

INTERTEMPORAL SENTIMENT ANALYSIS ON INDONESIA ISLAMIC BANK


Konsep tentang perasaan konsumen merujuk pada perkiraan umum konsumen terhadap pemasaran dan pasar. Bagi para pembuat keputusan yang berkaitan dengan pemasaran, mengikuti sentimen konsumen dapat memberikan indikasi awal tentang perilaku dan kekuatan pasar. Sentimen konsumen akan sangat berguna untuk mengukur keadaan pasar secara umum dan juga sebagai latar belakang untuk mengetahui secara lebih mendalam dan terperinci mengenai kebutuhan, keinginan, dan kepuasan konsumen.
Produsen harus memahami sisi psikografik konsumennya. Psikografis (psychographyc) merupakan konsep menyangkut kepuasan konsumen terkait dengan gaya hidup. Psikografis merupakan instrumen untuk mengukur gaya hidup yang memberikan pengukuran kuantitatif. Konsumen membeli barang dan jasa dapat dilandasi karena tiga hal yaitu kegiatan (activities), minat (interest), dan opini (opinion) disingkat dengan AIO. AIO akan mengarahkan konsumen untuk memilih dan membeli produk mana yang sesuai dengan kebutuhan dan keinginannya sehingga kebutuhan dan keinginannya terpuaskan.
Salah satu analisis dalam konsep psikografis adalah analisis sentimen. Analisis sentimen adalah proses mengidentifikasi dan mengkategori opini/pendapat yang diungkapkan berupa teks. Analisis ini terutama untuk menentukan bagaimana sikap atas topik maupun produk tertentu, apakah positif, negatif ataupun netral. 
Bank syariah, dalam beberapa tahun terakhir menghadapi tantangan yang cukup banyak. Baik yang bersifat mikro maupun makro. Selain karena usia yang ‘baru’ 25 tahun dari masa kelahirannya, bank syariah di Indonesia juga relatif berbeda dengan negara jiran, Malaysia. Salah satu perbedaan misalnya, perspektif pengembangan bank syariah di Indonesia lebih bersifat ‘bottom up’ dibanding Malaysia yang ‘top down’.

Kali ini SMART mencoba melakukan analisis sentimen atas bank syariah dari waktu ke waktu. Sumber data teks adalah pemberitaan media terkait perkembangan bank syariah di Indonesia sejak 2012 hingga 2016. Setiap tahun diambil 35 dokumen pemberitaan sehingga total ada 175 dokumen.
Hasilnya terlihat seperti dalam gambar. Ada beberapa temuan menarik. Pertama, mulai 2012 hingga 2014, sentimen positif atas bank syariah mengalami kenaikan. Sebaliknya, sentimen negatif berangsur menurun. Demikian pula kategori sentimen yang netral. Periode ini menjadi masa yang baik dalam konteks peningkatan persepsi dan sentimen publik atas bank syariah.
Kedua, mulai tahun 2014 hingga 2016 ini, kondisi sentimen atas perbankan syariah justru mengalami penurunan. Jika pada tahun 2014 nilai sentimen positif adalah 83%, pada 2015 nilainya menjadi 54% dan 2016 menjadi hanya 49%. Berkebalikan dengan itu, sentimen negatif atas bank syariah malah meningkat. Jika pada 2014 nilainya hanya 3%, pada tahun selanjutnya meningkat menjadi 9% (2015) dan 26% (2016).
Saat ini, bank syariah menghadapi tantangan cukup berat. Bukan hanya dari eksternal, tapi juga kalangan ‘internal’. Imbas kelesuan kondisi bisnis-ekonomi tahun 2014-2015 direspon lebih lambat dan baru terasa saat ini oleh industri perbankan. Ada time lag. Selain itu, persepsi bahwa ‘bank syariah sama saja dengan bank konvensional’ menjadi alasan krusial lain. Edukasi terhadap publik memang belum sepenuhnya berhasil. Para stakeholder perbankan syariah perlu berpikir keras untuk menyusun strategi marketing dan sosialisasi agar lebih mampu direspon positif oleh pasar.

Kamis, 11 Agustus 2016

ANALISIS SENTIMEN ATAS LKMS DI INDONESIA



Setelah mengukur sentimen atas beberapa tema seperti perbankan syariah di Indonesia, zakat, hingga wakaf, kali ini SMART mencoba menghitung sentimen atas lembaga keuangan mikro syariah di Indonesia. Seperti yang telah diketahui, Sentiment Analysis adalah penelitian yang biasa digunakan untuk mengukur sentimen publik atas suatu tema permasalahan. 

Sebagai sumber data, dipilih 60 dokumen spesifik, baik berupa artikel maupun jurnal terkait keuangan mikro syariah di Indonesia. Termasuk di dalamnya adalah tulisan menarik dari Hans Dieter Seibel, seorang pakar keuangan mikro kenamaan dunia. HD Seibel adalah profesor dari University of Cologne Jerman yang banyak menulis dan meneliti tentang tema microfinance. Tools Semantria dipakai sebagai alat bantu pengolahan.

Hasil analisis sentimen terhadap kondisi keuangan mikro syariah di Indonesia memperlihatkan kondisi berikut. Sebanyak 60% menunjukkan sentimen positif. Artinya mayoritas literatur menunjukkan sentimen positif. Sementara itu hanya sebanyak 7% menunjukkan sentimen negatif. Sisanya sebesar 33% menunjukkan sentimen yang netral.

Di Indonesia, potensi keuangan mikro secara umum memang sangat prospektif. Dr. Mohammad Obaidullah, peneliti IRTI IDB bahkan telah berkali-kali datang ke Indonesia untuk meneliti konsep keuangan mikro, termasuk keuangan mikro syariah. Keuangan mikro Indonesia menurutnya menjadi industri bahkan sistem yang mapan dibandingkan negara-negara lain di dunia. Oleh sebab itu, sangat dimungkinkan pada masa mendatang untuk dibangun model keuangan mikro Indonesia agar dapat direplikasi di dunia Internasional.

Selasa, 09 Agustus 2016

SENTIMENT ANALYSIS ON INDONESIA WAQF



Sentiment Analysis adalah penelitian yang biasa digunakan untuk mengukur sentimen publik atas suatu tema permasalahan. Sentiment Analysis adalah sebuah cabang penelitian pada domain Text Mining yang mulai booming pada awal tahun 2002-an. Risetnya mulai marak semenjak paper dari B.Pang dan L.Lee muncul. Sederhananya, text mining lebih bertujuan untuk mengolah kata, bukan mengolah angka.

Sentiment analysis terdiri dari 3 subproses besar yakni: Subjectivity Classification, Orientation Detection dan Opinion Holder & Target Detection. Hingga saat ini, hampir sebagian besar penelitian di bidang sentiment analysis ditujukan untuk Bahasa Inggris karena memang Tools/Resources untuk bahasa inggris sangat banyak. Beberapa resources yang sering digunakan untuk sentiment analysis adalah SentiWordNet dan WordNet.

SMART Consulting sebagai sebuah lembaga yang fokus dalam riset ekonomi keuangan syariah mencoba mengukur tingkat sentimen publik terhadap kondisi wakaf di Indonesia. Desk khusus yang membidangi riset terkait wakaf adalah WAQFI atau Waqf Research Institute. Sebagai sumber data, dipilihlah 80 dokumen spesifik yang digunakan, baik berupa artikel maupun jurnal terkait wakaf di Indonesia. Tools Semantria dipakai sebagai alat bantu pengolahan.

Hasil analisis sentimen terhadap kondisi perwakafan di Indonesia memperlihatkan kondisi berikut. Sebanyak 2% menunjukkan sentimen sangat positif (high positif). Demikian pula 64% mengarah kepada sentimen positif. Sementara itu sebanyak 11% menunjukkan sentimen negatif. Sisanya sebesar 23% menunjukkan sentimen yang netral.

Fakta yang ada adalah, jumlah luas tanah wakaf di Indonesia merupakan harta wakaf terbesar di dunia. Kesadaran umat Islam di Indonesia terhadap wakaf juga sudah cukup tinggi. Sementara itu, kondisi geografis Indonesia yang sangat luas, memungkinkan berkembangnya wakaf jika dikelola secara produktif. Seperti halnya zakat, wakaf juga merupakan instrumen sosial Islam yang akan berperan signifikan di masa mendatang.

Jumat, 05 Agustus 2016

MAQASID SHARIAH: MANAKAH YANG DOMINAN?



Maqasid Syariah secara istilah adalah tujuan-tujuan syariat Islam yang terkandung dalam setiap aturannya. Imam Asy-Syathibi adalah yang pertama kali mengungkapkan tentang syari’ah dan fungsinya bagi manusia seperti ungkapannya dalam kitab al-Muwaafaqaat.

Al-Syatibi menjelaskan secara detil mengapa hukum itu diturunkan. Lewat konsepnya trilogi kebutuhan yaitu kebutuhan primer (dharuriyat), sekunder (hajiyat) dan komplementer (tahsiniyat), al-Syatibi menampakkan bahwa hukum Islam selalu kontekstual, sesuai dengan konteks tempat dan waktu. 

Tujuan syari’at berujung pada kemashlahatan sebagai substansinya. Ia dapat terealisasikan apabila lima unsur pokok dapat diwujudkan dan dipelihara. Kelima unsur pokok itu adalah: (a) agama, (b) jiwa, (c) keturunan, (d) akal, dan (e) harta. Pertanyaannya adalah, dari kelima unsur pokok di atas, manakah yang dominan dibanding dengan yang lainnya? Melalui pendekatan text analytic, pertanyaan ini coba dijawab. 

Sebagai objek, dipilih 30 dokumen yang terkait dengan pembahasan maqashid syariah. Hasilnya terlihat pada gambar. Dari kelima unsur pokok di atas, agama (DIIN) menjadi unsur paling dominan dengan nilai 54,7%. Selanjutnya adalah akal (AQL) sebesar 20,8% dan jiwa (NAFS) sebesar 11,3%. Unsur pokok yang lain adalah harta (MAAL) dan keturunan (NASB) sebesar 9,4% dan 3,8%.

Term yang berkaitan dengan unsur pokok Diin adalah 'Law' dan 'Philosophy'. Sementara Aql sangat berkaitan dengan 'Logic', 'Mind' dan 'Education'. Unsur pokok Nafs berkaitan dengan term 'Health' dan Maal berkaitan erat dengan 'Business'. Unsur terakhir yakni Nasb berkaitan dengan 'Physic'.

Tema maqashid syariah dalam konteks ekonomi dan keuangan Islam, krusial untuk dibahas. Maqashid syariah adalah jantung dalam ilmu ushul fiqh, karena itu maqashid syariah menduduki posisi yang sangat penting dalam merumuskan konsepsi akad dalam ekonomi syariah, menciptakan produk-produk perbankan dan keuangan syariah.

Senin, 01 Agustus 2016

ANALISIS SENTIMEN ZAKAT DI INDONESIA


Sentiment Analysis adalah sebuah cabang penelitian pada domain Text Mining yang mulai booming pada awal tahun 2002-an. Risetnya mulai marak semenjak paper dari B.Pang dan L.Lee muncul. Sederhananya, text mining lebih bertujuan untuk mengolah kata, bukan mengolah angka.
Sentiment analysis terdiri dari 3 subproses besar yakni: Subjectivity Classification, Orientation Detection dan Opinion Holder & Target Detection. Hingga saat ini, hampir sebagian besar penelitian di bidang sentiment analysis ditujukan untuk Bahasa Inggris karena memang Tools/Resources untuk bahasa inggris sangat banyak. Beberapa resources yang sering digunakan untuk sentiment analysis adalah SentiWordNet dan WordNet.
SMART Consulting sebagai sebuah lembaga yang fokus dalam riset ekonomi syariah mencoba mengukur tingkat sentimen publik terhadap kondisi zakat di Indonesia. Dipilih 30 dokumen spesifik yang digunakan sebagai sumber data. Tools Semantria digunakan sebagai alat bantu pengolahan.
Hasil analisis sentimen terhadap kondisi zakat di Indonesia memperlihatkan kondisi berikut. Sebanyak 27% menunjukkan sentimen positif. Demikian pula 27% mengarah kepada sentimen negatif. Sisanya sebesar 46% menunjukkan sentimen yang netral.
Rasionalisasi yang memungkinkan adalah, meskipun realisasi himpunan dana zakat baru sekitar 1,3 persen dari potensinya, namun trendnya menunjukkan hal positif. Inovasi yang dilakukan OPZ maupun awareness masyarakat muslim yang kian hari kian paham akan pentingnya zakat jika diberdayakan secara optimal, menjadi berita menggembirakan. Seperti halnya wakaf, zakat juga merupakan instrumen sosial Islam yang akan berperan signifakan di masa mendatang. Insya Allah.

Rabu, 27 Juli 2016

TEXT ANALYTICS ATAS LITERATUR ZAKAT


Potensi zakat Indonesia dalam setahun mencapai Rp 217 triliun (versi lain mencapai Rp 286 triliun). Tapi realisasinya saat ini menurut riset SMART Consulting baru terhimpun sekitar 1,3 persen saja. Faktanya, dalam 20 tahun terakhir perkembangan lembaga amil zakat di Indonesia berkembang cukup pesat. Namun di sisi lain, jumlah penduduk miskin dan kaum dhuafa di Indonesia justru terus bertambah.
Zakat memang unik. Ia sekaligus memiliki 3 dimensi ibadah. Personal, sosial dan ekonomi. Pertama, dimensi spiritual personal. Zakat merupakan perwujudan keimanan kepada Allah SWT sekaligus sebagai instrumen untuk purifikasi dan penyucian jiwa dari segala penyakit ruhani, seperti bakhil dan tidak peduli sesama.

Kedua adalah dimensi sosial, dimana zakat berorientasi pada upaya untuk menciptakan harmonisasi kondisi sosial masyarakat. Hubungan antara muzakki dan mustahik lebih terjaga. Miskin dan kaya diharapkan tidak terlalu timpang perbedaannya. Melalui zakat, hal itu sangat mungkin dicapai dan direalisasikan.
Yang ketiga adalah dimensi ekonomi, yang tercermin pada dua konsep utama, yaitu pertumbuhan ekonomi berkeadilan (QS 30:39) dan mekanisme sharing dalam perekonomian (QS 51:19). Tujuan utamanya adalah untuk meningkatkan kesejahteraan kaum dhuafa. Pada jangka pendek, kebutuhan primer mustahik dapat terpenuhi, sementara pada jangka panjang, daya tahan ekonomi mereka akan meningkat, sekaligus menstimulasi pertumbuhan ekonomi.
Berdasarkan hasil riset terkait terma zakat atas 30 dokumen spesifik dengan pendekatan text mining, didapatkan beberapa hasil. Pertama, term zakat berkaitan dengan beberapa kategori dan subkategori. Business (0,368), Health (0,184) dan Labor (0,158) menjadi 3 kategori utama. Sementara kategori berikutnya adalah: International Relation (0,079), IT (0,079), Research (0,079) dan Society (0,053).
Kedua perihal sentiment analysis. Analisis sentimen terhadap kondisi zakat di Indonesia memperlihatkan kondisi berikut. Sebanyak 27% menunjukkan sentimen positif. Demikian pula 27% mengarah kepada sentimen negatif. Sisanya sebesar 46% menunjukkan sentimen yang netral. Meskipun realisasi himpunan dana zakat baru sekitar 1,3 persen dari potensinya, namun trendnya menunjukkan hal yang menggembirakan. Terlihat dari inovasi yang dilakukan OPZ maupun awareness masyarakat muslim yang kian hari kian paham akan pentingnya zakat jika diberdayakan secara optimal.

Kamis, 21 Juli 2016

MENGENAL ISTILAH TEXT MINING


Text mining atau text analytics merupakan sebuah istilah yang mendeskripsikan sebuah teknologi yang mampu menganalisis data teks semi-terstruktur maupun tidak terstruktur, hal inilah yang membedakannya dengan data mining dimana data mining mengolah data yang sifatnya terstruktur. Pada dasarnya, text mining merupakan bidang interdisiplin yang mengacu pada perolehan informasi (information retrieval), data mining, pembelajaran mesin (machine learning), statistik, dan komputasi linguistik (Jiawei, dkk, 2012). 

Secara umum konsep pekerjaan text mining mirip dengan data mining, yaitu penggalian prediktif dan penggalian deskriptif. Text mining mengekstrak indeks numerik yang bermakna dari teks dan kemudian informasi yang terkandung dalam teks akan diakses dengan menggunakan berbagai algoritma data mining (statistik dan machine learning) (Miner et al, 2012).  

Penggunaan dan penelitian mengenai text mining telah banyak mendapat perhatian dan aktif dilakukan seiring dengan semakin banyaknya data teks yang diperoleh dari berbagai jaringan sosial, web, dan aplikasi lainnya. Sebagian besar informasi teks yang disimpan tersebut seperti misalnya artikel berita, makalah, buku, perpustakaan digital, pesan email, blog, dan halaman web. Text mining dapat menganalisis dokumen, mengelompokkan dokumen berdasarkan kata-kata yang terkandung di dalamnya, serta menentukan kesamaan di antara dokumen untuk mengetahui bagaimana mereka berhubungan dengan variabel lainnya (Statsoft, 2015). 

Minggu, 17 Juli 2016

MENGENAL BEBERAPA ANALISIS DALAM TEXT MINING



Melanjutkan hasil riset kemarin terkait text analytics atau text mining, kali ini akan dijelaskan beberapa analisis dalam pendekatan olah kata ini. Sedikitnya ada 5 analisis penting yang dapat digunakan dan dielaborasi. Objek data dalam analisis ini adalah 50 literatur buku terkait keuangan Islam.

Pertama adalah Query Analysis. Query adalah analisa untuk mencari obyek berdasarkan atribut data yang dimiliki. Query analysis adalah proses yang digunakan dalam database yang menggunakan SQL untuk menentukan bagaimana agar lebih mengoptimalkan query untuk kinerja. Hasilnya, dari 50 literatur keuangan Islam, terbagi dalam 3 kelompok. Education sebesar 70%, religion 20% dan business 10%.

Kedua adalah Sentiment Analysis. Analisis sentimen merupakan proses klasifikasi dokumen tekstual ke dalam tiga kategori, yaitu kelas sentimen positif, negatif dan netral. Dari objek data yang diolah, sebanyak 64% memiliki penilaian positif, 28% netral dan hanya 8% yang memiliki sentimen penilaian negatif.

Ketiga adalah Phrases Analysis. Frase adalah sebuah makna linguistik. Lebih tepatnya, frasa merupakan satuan linguistik yang lebih besar dari kata dan lebih kecil dari klausa dan kalimat. Frasa adalah kumpulan kata nonpredikatif. Artinya frasa tidak memiliki predikat dalam strukturnya. Setelah diolah, frase yang paling banyak muncul "Islamic Finance" sebesar 26%. Selanjutnya adalah frase "Islamic Banking" sebesar 6% dan ketiga adalah "Islamic Law" 5%. Sisanya adalah frase-frase lain. 

Keempat adalah Category Analysis. Tujuan dari analisis ini adalah, mengklasifikasi objek data berdasarkan kategori tertentu. Hasilnya seperti yang baru lalu ditampilkan. Business (50%) dan Finance (42%) yang paling dominan dibanding kategori lain seperti: Accounting, IT, Politics etc. 

Last but not least adalah Summary Analysis. Yang terakhir ini mempunyai fungsi dan kegunaan melakukan ekstraksi dari data yang banyak menjadi hanya beberapa kesimpulan penting. Misal, sebuah buku yang terdiri dari ratusan halaman dapat di-ekstrak menjadi hanya 3-4 paragraf yang merupakan kesimpulan dan summary terpenting dari keseluruhan.

Kamis, 07 Juli 2016

CATEGORY ANALYSIS ON ISLAMIC FINANCE LITERATURE



Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. 

Sementara itu text mining memiliki definisi mengolah data yang berupa teks dimana sumber data biasanya di dapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antardokumen. 

Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks (text categorization) dan pengelompokan teks (text clustering).

Kali ini SMART mencoba melakukan riset terkait penelusuran literatur keuangan Islam berupa buku bertema "Islamic Finance" di seluruh dunia. Yang menjadi objek data terpilih 50 buku Islamic Finance dengan tools Semantria sebagai alat bantu olah data. Ke-50 buku tersebut terutama diambil abstraksi/summary-nya dari portal penjualan buku terbesar, amazon.com.

Hasilnya tampak pada gambar di bawah. Dari seluruh objek buku bertema Islamic Finance, tersarikan menjadi beberapa kategori yakni: Business, Finance, Education, Accounting, Law, Mathematics, Research, IT dan Politics. Dari seluruh kategori tersebut, ada 2 yang dominan yaitu: Business (50%) dan Finance (42%). Sisanya adalah kategori yang lain.

Untuk kedua kategori yang dominan, term Business memiliki category strength antara 0.632 hingga 1.000. Artinya memiliki kekuatan kategorisasi yang kuat. Demikian pula dengan term Finance yang memiliki category strength antara 0.631 hingga 1.000, sedikit di bawah kategori Business. Sementara itu term lain seperti Education, Accounting, Law, Mathematics, Research, IT dan Politics hanya memiliki nilai category strength di bawah 0.553. Jauh lebih rendah dibanding 2 term awal (Business dan Finance).

Untuk kategori Business, terbagi lagi ke dalam sub kategori: Markets, Market trends, Behavioral finance, Financial risk, Cash flow, Basic financial concepts, Distributors, Economic sectors, Inflation, Interest, Macroeconomics dan Product management.

Sementara itu kategori Finance terbagi ke dalam sub kategori: Financial regulatory authorities, Cooperative banking, Private equity secondary market, Bank regulation, Sovereign wealth funds, Bank failures, Banking technology, Ethical banking. 

Penggunaan Semantria dalam text mining ini dapat digunakan untuk berbagai tujuan di antaranya: analisis sentimen, kategorisasi, ekstraksi entitas baik person, perusahaan, produk maupun tempat. Selain itu, tools ini juga dapat digunakan untuk intention analysis dan tujuan penggunaan analisis teks secara umum.

Jumat, 01 Juli 2016

SENTIMENT ANALYSIS BANK SYARIAH INDONESIA: PENDEKATAN TEXT ANALYTICS



Sentiment Analysis merupakan sebuah cabang penelitian pada domain Text Mining yang mulai booming pada awal tahun 2002-an. Risetnya mulai marak semenjak paper dari B.Pang dan L.Lee muncul. Sederhananya, text mining lebih bertujuan untuk mengolah kata, bukan mengolah angka.

Sentiment analysis terdiri dari 3 subproses besar yakni:
Subjectivity Classification, Orientation Detection dan Opinion Holder & Target Detection. Hingga saat ini, hampir sebagian besar penelitian di bidang sentiment analysis ditujukan untuk Bahasa Inggris karena memang Tools/Resources untuk bahasa inggris sangat banyak sekali. Beberapa resources yang sering digunakan untuk sentiment analysis adalah SentiWordNet dan WordNet.

SMART Consulting mencoba mengukur tingkat sentimen publik terhadap bank syariah di Indonesia. Terutama juga dikaitkan dengan komparasi terhadap perkembangan bank syariah di negara tetangga, Malaysia. Dipilih 20 dokumen yang digunakan sebagai sumber data. Tools Semantria digunakan sebagai alat bantu.

Hasilnya menunjukkan bahwa dari data yang ada, hanya 30% dokumen yang memiliki sentimen positif atas perkembangan bank syariah di Indonesia. Sementara itu, 35% dokumen bersentimen negatif. Sisanya, yakni sebesar 35% lebih mengarah pada penilaian netral. 

Merujuk hasil ini, pada faktanya, sentimen negatif lebih dominan dibanding dengan sentimen positif atas perkembangan industri bank syariah di Indonesia. Tentu saja banyak alasan yang mendasarinya: Kekurangan SDM syariah yang handal, persepsi masyarakat yang kurang baik, hingga regulasi yang kurang mendukung dibanding yang dilakukan otoritas yang sama di negeri jiran.