BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Packages R untuk Data Mining




Assalamualaikum wr wb
Sudah lama sejak postingan pertama belum posting lagi dikarenakan banyak kesibukan di dunia nyata hehe. Ok kali ini saya mau membagikan beberapa packages R yang digunakan pada data mining. Sebenarnya masih banyak packages yang bisa di terapkan dalam analisis di bawah ini tetapi penulis hanya melihat packages yang popular yang digunakan supaya pembaca akan mudah mencari syntax dan teknik – teknik nya. Sebelum jauh ke packages perlu di ketahui terlebih dahulu terkait dengan pengertian dan apa itu data mining. Berikut penjelasannya,

Pengertian Data Mining

Data mining dalam arti Bahasa Indonesia yaitu menggali data atau penggalian data. Data Mining adalah Suatu proses penggalian informasi yang tidak diketahui secara manual dari suatu basisdata dengan melihat dan menggali pola-pola tersebut sehingga data bisa di manipulasi menjadi sebuah informasi dengan mengenali pola-pola yang menarik dan unik dari data pada basisi data.

Konsep Data Mining

Data mining sangat dibutuhkan pada era sekarang karena pada era ini semua hal bisa diolah menjadi data sehingga akan terbentuk banyak sekali data atau data yang sangat besar. Dari data yang besar tersebut bisa diterapkan data mining untuk melihat pola data membuat data yang sangat banyak tersebut menjadi sangat berharga. Sekarang banyak perusahaan besar yang ada didunia mulai merekrut orang orang yang mampu menganalisis data tersebut.

Berikut packages beberapa packages yang sering digunakan

Fungsi diikuti dengan tanda “()” untuk semua packages

Classification with R
1.      Decision trees: rpart, party
2.      Random forest: randomForest, extendedForest, party
3.      SVM: e1071, kernlab
4.      Neural networks: nnet, neuralnet, RSNNS
5.      Performance evaluation: ROCR
Clustering with R
1.      k-means: kmeans(), kmeansruns()10 I k-medoids: pam(), pamk()
2.      Hierarchical clustering: hclust(), agnes(), diana()
3.      DBSCAN: fpc
4.      BIRCH: birch
Association Rule Mining with R
1.      Association rules: apriori(), eclat() in package arules
2.      Sequential patterns: arulesSequence
3.      Visualisation of associations: arulesViz
Text Mining with R
1.      Text mining: tm
2.      Topic modelling: topicmodels, lda
3.      Word cloud: wordcloud
4.      Twitter data access: twitteR
Time Series Analysis with R
1.      Time series decomposition: decomp(), decompose(), arima(), stl()
2.      Time series forecasting: forecast
3.      Time Series Clustering: TSclust
4.      Dynamic Time Warping (DTW): dtw
Social Network Analysis with R
1.      Packages: igraph, sna
2.      Centrality measures: degree(), betweenness(), closeness(), transitivity()
3.      Clusters: clusters(), no.clusters()
4.      Cliques: cliques(), largest.cliques(), maximal.cliques(), clique.number()
5.      Community detection: fastgreedy.community(), spinglass.community()
R and Big Data
1.      Hadoop : RHadoop, RHIPE
2.      Spark : SparkR - R frontend for Spark
3.      H2O : h2o
4.      MongoDB : rmongodb, RMongo
R and Hadoop
1.     Packages: RHadoop, RHive
2.     RHadoop is a collection of R packages:
·        rmr2 - perform data analysis with R via MapReduce on a Hadoop cluster
·        rhdfs - connect to Hadoop Distributed File System (HDFS)
·        rhbase - connect to the NoSQL HBase database
Mungkin sekian post kali ini terimakasih sudah berkunjung
Packages R untuk Data Mining Packages R untuk Data Mining Reviewed by Jimmy Pujoseno on May 21, 2017 Rating: 5

No comments:

Recent Post

Powered by Blogger.