数据发掘是从海量数据中提取有用信息的过程,通过算法搜索隐藏的信息。这一过程通常涉及多种技术和方法,包括统计分析、在线分析处理、情报检索、机器学习、专家系统等。数据发掘是人工智能和数据库研究领域的热门话题,旨在揭示数据库中的隐含信息,这些信息通常是未知的且具有潜在价值。
数据发掘是一种决策支持手段,主要依赖于人工智能、机器学习、模式识别、统计学、数据库管理和可视化技术,自动化地分析企业数据,从中挖掘潜在模式,帮助决策者制定有效的市场策略,降低风险,做出正确决策。数据发掘过程包括三个关键阶段:数据准备、数据发掘和结果呈现及解释。在这个过程中,数据可以与用户或知识库进行交互。
数据发掘的核心在于分析数据,寻找规律。具体步骤包括数据准备、规律寻找和规律展示。数据准备涉及从相关数据源中选择和整合数据,形成适合数据发掘的数据集;规律寻找则是通过特定方法找出数据中的规律;最后,规律展示则是以用户易于理解的方式,例如通过可视化手段,呈现这些规律。数据发掘的应用领域包括关联分析、聚类分析、分类分析、异常分析、特殊群体分析和演变分析等。
机器学习是一门跨学科的专业,融合了概率论、统计学、逼近理论、凸分析和算法复杂度理论等多种学科的知识。它的目标是让计算机模拟或实现人类的学习行为,获取新知识或技能,并不断优化自身功能。作为人工智能的核心部分,机器学习是使计算机具备智能的关键路径。
机器学习的研究范围广泛,包括但不限于:如何在经验学习中提升具体算法的性能;研究能够通过经验自动改进的计算机算法;利用数据或历史经验来优化计算机程序的表现。机器学习的定义多种多样,但都指向同一个目标——使计算机能够像人一样学习和适应。
以下是精选的数据发掘和机器学习软件列表:
- Amazon Rekognition
- Angoss
- Anne O'Tate
- Apache Flume
- Apache MXNet
- Aphelion (软件)
- BigDL
- Caffe (软件)
- CellCognition
- Chainer
- Comparison of deep-learning software
- DADiSP
- Data Mining Extensions
- Deep Web Technologies
- Deeplearning4j
- Distributed RDlib
- Encog
- ELKI
- Feature Selection Toolbox
- FICO
- Fluentd
- Folding@home
- General Architecture for Text Engineering
- GNU Octave
- GraphLab
- Gremlin (编程语言)
- Ilastik
- Information Harvesting
- Jubatus
- Julia (编程语言)
- Keras
- KNIME
- KXEN Inc.
- L-1 Identity Solutions
- LanguageWare
- Lattice Miner
- LIBSVM
- Linguamatics
- Apache Mahout
- Mallet (软件项目)
- Maple (软件)
- Massive Online Analysis
- MATLAB
- MeeMix
- Megvii
- Microsoft Cognitive Toolkit
- ML.NET
- mlpack
- mlpy
- ND4J (软件)
- ND4S
- NetOwl
- Neural Designer
- Never-Ending Language Learning
- OpenNN
- Oracle Data Mining
- Orange (软件)
- Programming with Big Data in R
- Picollator
- Pipeline Pilot
- Piranha (软件)
- Probabilistic Action Cores
- PyTorch
- R (编程语言)
- RapidMiner
- Rattle GUI
- Renjin
- rnn (软件)
- SAS (软件)
- Scikit-learn
- Self-Service Semantic Suite
- SenseTime
- Shogun (工具箱)
- Sketch Engine
- SolveIT Software
- Apache Spark
- SPSS Modeler
- Apache SystemML
- Tanagra (机器学习)
- TensorFlow
- List of text mining software
- Torch (机器学习)
- UIMA
- VIGRA
- Vowpal Wabbit
- Waffles (机器学习)
- Weka (机器学习)
- Wolfram Language
- Wolfram Mathematica
- XGBoost
- Yooreeka
- Zeroth (软件)
请注意,以上软件列表来源于维基百科的分类,用于展示数据发掘和机器学习领域的多种工具和技术。