「首席架构师推荐」精选数据挖掘和机器学习软件列表

简介: 「首席架构师推荐」精选数据挖掘和机器学习软件列表

数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。[1]

数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。知识发现过程由以下三个阶段组成:①数据准备;②数据挖掘;③结果表达和解释。数据挖掘可以与用户或知识库交互。[1]

数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。[1]

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能的核心,是使计算机具有智能的根本途径。

机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式, 并将现有内容进行知识结构划分来有效提高学习效率。[1]

机器学习有下面几种定义:

(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。

(2)机器学习是对能通过经验自动改进的计算机算法的研究。

(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

精选数据挖掘和机器学习软件列表




A

  • Amazon Rekognition
  • Angoss
  • Anne O'Tate
  • Apache Flume
  • Apache MXNet
  • Aphelion (software)

B

  • BigDL

C

  • Caffe (software)
  • CellCognition
  • Chainer
  • Comparison of deep-learning software

D

  • DADiSP
  • Data Mining Extensions
  • Deep Web Technologies
  • Deeplearning4j
  • Distributed R
  • Dlib

E

  • Encog
  • ELKI

F

  • Feature Selection Toolbox
  • FICO
  • Fluentd
  • Folding@home

G

  • General Architecture for Text Engineering
  • Apache Giraph
  • GNU Octave
  • GraphLab
  • Gremlin (programming language)

I

  • Ilastik
  • Information Harvesting

J

  • Jubatus
  • Julia (programming language)

K

  • Keras
  • KNIME
  • KXEN Inc.

L

  • L-1 Identity Solutions
  • LanguageWare
  • Lattice Miner
  • LIBSVM
  • Linguamatics

M

  • Apache Mahout
  • Mallet (software project)
  • Maple (software)
  • Massive Online Analysis
  • MATLAB
  • MeeMix
  • Megvii
  • Microsoft Cognitive Toolkit
  • ML.NET
  • Mlpack
  • Mlpy

N

  • ND4J (software)
  • ND4S
  • NetOwl
  • Neural Designer
  • Never-Ending Language Learning

O

  • OpenNN
  • Oracle Data Mining
  • Orange (software)

P

  • Programming with Big Data in R
  • Picollator
  • Pipeline Pilot
  • Piranha (software)
  • Probabilistic Action Cores
  • PyTorch

R

  • R (programming language)
  • RapidMiner
  • Rattle GUI
  • Renjin
  • Rnn (software)

S

  • SAS (software)
  • Scikit-learn
  • Self-Service Semantic Suite
  • SenseTime
  • Shogun (toolbox)
  • Sketch Engine
  • SolveIT Software
  • Apache Spark
  • SPSS Modeler
  • Apache SystemML

T

  • Tanagra (machine learning)
  • TensorFlow
  • List of text mining software
  • Torch (machine learning)

U

  • UIMA

V

  • VIGRA
  • Vowpal Wabbit

W

  • Waffles (machine learning)
  • Weka (machine learning)
  • Wolfram Language
  • Wolfram Mathematica

X

  • XGBoost

Y

  • Yooreeka

Z

  • Zeroth (software)
相关文章
|
1天前
|
机器学习/深度学习 人工智能 缓存
人工智能平台PAI产品使用合集之机器学习PAI实践参考在哪里
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
12月前
|
机器学习/深度学习 人工智能 算法
首席架构师推荐」精选数据挖掘和机器学习软件列表
首席架构师推荐」精选数据挖掘和机器学习软件列表
|
12月前
|
机器学习/深度学习 人工智能 算法
「数据分析」精选数据挖掘和机器学习软件列表
「数据分析」精选数据挖掘和机器学习软件列表
|
12月前
|
机器学习/深度学习 设计模式 自然语言处理
「数据分析」精选文本挖掘软件列表
「数据分析」精选文本挖掘软件列表
|
机器学习/深度学习 人工智能 自然语言处理
干货!数据分析&AI资料合辑~
干货!数据分析&AI资料合辑~
|
机器学习/深度学习 数据采集 人工智能
《机器学习案例实战(第2版)》出版
机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书基于Python语言,实现了12个典型的实战案例,其内容涵盖了机器学习的基础算法,主要包括统计学习基础、可视化、常用的分类算法、文本分析、卷积神经网络、循环神经网络、注意力机制、生成对抗网络、电子推荐系统等理论。本书深入浅出,以实际应用的项目作为案例,实践性强,注重提升读者的动手操作能力,适合作为高等院校本科生、研究生机器学习、深度学习、数据挖掘等课程的实验教材,也可作为对机器学习和深度学习感兴趣的研究人员和工程技术人员的参考资料。 感谢阿里云计算有限公司在案例写作过程中的支持!
636 0
《机器学习案例实战(第2版)》出版
|
机器学习/深度学习 数据采集 人工智能
【人工智能】机器学习基础速览 1
【人工智能】机器学习基础速览
245 0
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习基础速览 2
【人工智能】机器学习基础速览
275 0
  【人工智能】机器学习基础速览 2
|
机器学习/深度学习 大数据 数据挖掘
大数据算命系列之用机器学习评估你的相亲战斗力 | 《阿里云机器学习PAI-DSW入门指南》
害,想知道你的相亲战斗力是多少吗?动手体验数据科学,成为PAI-DSW探索者~你想要知道的都在这里!
大数据算命系列之用机器学习评估你的相亲战斗力 | 《阿里云机器学习PAI-DSW入门指南》
|
搜索推荐
【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战
人工智能千千万,没法落地都白干。 自从上次老司机用神经网络训练了热狗识别模型以后,群众们表示想看一波更加接地气,最好是那种能10分钟上手,一辈子受用的模型。 这次,我们就通过某著名电商公司的公开数据集,在阿里云大数据生态之下快速构建一个基于协同过滤的推荐系统!
5190 0
http://www.vxiaotou.com