Red de conocimiento informático - Conocimiento del nombre de dominio - ¿Cuáles son las herramientas de minería de datos de código abierto?

¿Cuáles son las herramientas de minería de datos de código abierto?

1. RapidMiner

Esta herramienta está escrita en lenguaje Java y proporciona tecnología de análisis avanzada a través de un marco basado en plantillas. La mayor ventaja de esta herramienta es que los usuarios no necesitan escribir ningún código. Se proporciona como un servicio, no como software nativo. Cabe mencionar que esta herramienta ocupa el primer lugar en la lista de herramientas de minería de datos.

Además, además de la minería de datos, RapidMiner también proporciona funciones como preprocesamiento y visualización de datos, análisis predictivo y modelado, evaluación e implementación estadísticos. Lo que es aún más poderoso es que también proporciona soluciones, modelos y algoritmos de aprendizaje de WEKA (un entorno de análisis inteligente) y scripts R.

RapidMiner se distribuye bajo la licencia de código abierto AGPL y se puede descargar desde SourceForge. SourceForge es un lugar centralizado para que los desarrolladores lleven a cabo el desarrollo y la gestión. Aquí se han instalado una gran cantidad de proyectos de código abierto, incluido MediaWiki utilizado por Wikipedia.

2. WEKA

La versión nativa no Java de WEKA está desarrollada principalmente para analizar datos en el campo agrícola. La herramienta está basada en una versión de Java, es muy sofisticada y se utiliza en muchas aplicaciones diferentes, incluida la visualización y los algoritmos para el análisis de datos, así como el modelado predictivo. La ventaja sobre RapidMiner es que es gratuito bajo la Licencia Pública General GNU, ya que los usuarios pueden optar por personalizarlo a su gusto.

WEKA admite una variedad de tareas estándar de minería de datos, incluido el preprocesamiento, recopilación, clasificación, análisis de regresión, visualización y selección de características de datos.

WEKA será más potente con la incorporación del modelado de secuencias, pero no está incluido en este momento.

3. R-Programming

¿Qué harías si te dijera que el proyecto R, un proyecto GNU, está escrito por R (abreviatura de R-programming, en adelante denominado colectivamente? como R) en sí? Creo que está escrito principalmente en lenguajes C y FORTRAN, y muchos módulos están escritos en R, que es un software gratuito para cálculos estadísticos y gráficos para lenguajes de programación y entornos de software. El lenguaje R se utiliza ampliamente en la minería de datos, así como en el desarrollo de software estadístico y análisis de datos. La facilidad de uso y la escalabilidad también han aumentado considerablemente la popularidad de R en los últimos años.

Además de datos, también proporciona técnicas estadísticas y de gráficos, incluidos modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series temporales, clasificación, recopilación y más.