R programı ile metin madenciliği üzerine uygulama / An application on text mining with the R program
Abstract
Veri madenciliği yöntemi sayısal özellikli veya sayısal bir biçimde temsil edilen veri setlerinde kullanılan verileri istatistiksel bir şekilde analiz ederek sonuca ulaşmayı hedefler. Metin madenciliği ise metinlerin analizi ile yapısal olmayan, word, pdf formatlarındaki metin dosyaları ile sosyal medya paylaşımları ve blog dosyaları gibi elektronik metin ve belge yığınları arasından daha önceden keşfedilmeyen ve potansiyel olarak kullanılabilir verileri yapısal ve düzenli bir şekilde elde etme işlemidir. Metin madenciliği istatistiksel olarak metin üzerinden sonuca ulaşmayı hedeflemektedir. Metin halindeki bir veriden bilgi çıkarımının yapılabilmesi için öncelikle bazı işlemlerin gerçekleştirilmesi ve yapısal şekilde bulunmayan metinsel verilerin dönüştürülerek yapısal bir hale çevrilmesi gereklidir. Daha sonra yapısal hale dönüştürülen metinsel verilerin veri madenciliği yöntemlerinin uygulanılabileceği hale çevrilmiş olunur. Metinlerin toplanması ile başlayan bu süreç, toplanan metinlerin bazı veri ön işleme ve dönüştürme sürecinden sonra istatistik ve veri madenciliği yöntemlerinin kullanılmasıyla anlamlı bilgiye ulaşılır. Tez çalışmasında veri madenciliği ve metin madenciliği uygulama ve yöntemlerinden bahsedilip YÖK Akademi ve Dergipark Uygulamasından elde edilen veriler R programı kullanılarak ilk etapta veri ve metin madenciliği yöntemleriyle gerekli analizler yapıldıktan sonra kelime bulutları oluşturulmuştur.
Collections
DSpace@BEU by Bitlis Eren University Institutional Repository is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 Unported License..













