本文共计
5945字
读完大约
10分钟
半个多世纪的某个夏天,麦卡锡、明斯基等众科学家们举办了一次Party,共同研究用机器仿照智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出!
如今人工智能商业化正在快速推进中,比如我们熟习的图像识别、语音识别、自然措辞理解等都已被运用到浩瀚领域中。
但干系观点的理解程度,相信多数人还只勾留在「听说过」、「知道」这一阶段。为此,我们整理了一批领域内干系术语,从 A 到 Z,希望能让你对人工智有更清晰和全面的认识。大数据作为人工智能发展的基石,部分观点也会不才文中有所涉及。
# A #
聚合(Aggregation) – 搜索、合并、显示数据的过程。
算法(Algorithms) – 一组用于人工智能、神经网络或其他机器的规则或指令,以帮助它自己学习;分类、聚类、推举和回归是四种最常见的类型。
剖析法(Analytics) – 用于创造数据的内在涵义。
非常检测(Anomaly detection) – 在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示非常的词有以下几种:outliers,exceptions,surprises,contaminants。他们常日可供应关键的可实行信息。
人工智能(Artificial intelligence)– 机器仿照人类智力和行为做出决策、实行任务的能力。
人工神经网络(ANN)– 这种学习模型,仿照人脑运作,从而办理传统打算机系统难以办理的任务。
自主打算(Autonomic computing)– 系统自适应自我管理自身资源用于高等打算功能的能力,而无需用户输入。
# B #
行为剖析法(Behavioural Analytics) – 这种剖析法是根据用户的行为如“怎么做”、“为什么这么做”、以及“做了什么”来得出结论,而不是仅仅针对人物和韶光的一门剖析学科,它着眼于数据中的人性化模式。
大数据科学家(Big Data Scientist) – 能够设计大数据算法使得大数据变得有用的人。
生物测定术(Biometrics) – 根据个人的特色进行身份识别。
B字节 (BB: Brontobytes) – 约即是 1000 YB(Yottabytes),相称于未来数字化宇宙的大小。1 B字节包含了 27 个 0!
商业智能(Business Intelligence) – 是一系列理论、方法学和过程,使得数据更随意马虎被理解。
# C #
分类剖析(Classification analysis) – 从数据中得到主要的干系性信息的系统化过程; 这类数据也被称为元数据(meta data),是描述数据的数据。
云打算(Cloud computing) – 构建在网络上的分布式打算系统,数据是存储于机房外的(即云端)。
聚类剖析(Clustering analysis) – 它是将相似的工具聚合在一起,每类相似的工具组合成一个聚类(也叫作簇)的过程。这种剖析方法的目的在于剖析数据间的差异和相似性。
冷数据存储(Cold data storage) – 在低功耗做事器上存储那些险些不被利用的旧数据。但这些数据检索起来将会很耗时。
比拟剖析(Comparative analysis) – 在非常大的数据集中进行模式匹配时,进行一步步的比拟和打算过程得到剖析结果。
繁芜构造的数据(Complex structured data) – 由两个或多个繁芜而相互关联部分组成的数据,这类数据不能大略地由构造化查询措辞或工具(SQL)解析。
干系性剖析(Correlation analysis) – 是一种数据剖析方法,用于剖析变量之间是否存在正干系,或者负干系。
谈天机器人(Chatbots)– 谈天机器人(简称chatbot)通过文本对话、语音命令来仿照与人类用户进行对话。它们是有AI功能的打算机程序的常用界面。
认知打算(Cognitive computing)– 一种模拟人类大脑思维办法的打算模型。通过利用数据挖掘、自然措辞处理和模式识别来进行自学习(self-learning)。
卷积神经网络(CNN)– 一种识别和处理图像的神经网络。
# D #
数据挖掘(Data mining)– 通过查看数据集以创造和挖掘个中模式,从而进一步利用数据。
数据科学(Data science)– 结合统计、信息科学、打算机科学的科学方法、科学系统和科学过程的交叉学科,通过构造化或非构造化数据供应对征象的洞察。
决策树(Decision tree)– 一个基于分支的树模型,绘制决策及其可能后果的模型图,与流程图类似。
深度学习(Deep learning)– 机器通过由层叠信息层组成的人工神经网络自主模拟人类思维模式的能力。
数据库(Database) – 一个以某种特定的技能来存储数据凑集的仓库。
数据库即做事(Database-as-a-Service) – 支配在云真个数据库,即用即付,例如亚马逊云做事(AWS: Amazon Web Services)。
数据洗濯(Data cleansing) – 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的缺点,并供应数据同等性。
数据道德准则(Data ethical guidelines) – 这些准则有助于组织机构使其数据透明化,担保数据的简洁、安全及隐私。
数据订阅(Data feed) – 一种数据流,例如Twitter订阅和RSS
数据建模(Data modelling) – 利用数据建模技能来剖析数据工具,以此洞悉数据的内在涵义。
数据集(Data set)– 大量数据的凑集。
数据虚拟化(Data virtualization) – 数据整合的过程,以此得到更多的数据信息,这个过程常日会引入其他技能,例如数据库,运用程序,文件系统,网页技能,大数据技能等等。
去身份识别(De-identification) – 也称为匿名化(anonymization),确保个人不会通过数据被识别。
判别剖析(Discriminant analysis) – 将数据分类;按不同的分类办法,可将数据分配到不同的群组,种别或者目录。是一种统计剖析法,可以对数据中某些群组或集群的已知信息进行剖析,并从中获取分类规则。
分布式文件系统(Distributed File System) – 供应简化的,高可用的办法来存储、剖析、处理数据的系统。
文件存贮数据库(Document Store Databases) – 又称为文档数据库(document-oriented database), 为存储、管理、规复文档数据而专门设计的数据库,这类文档数据也称为半构造化数据。
# E #
探索性剖析(Exploratory analysis) – 在没有标准的流程或方法的情形下从数据中发掘模式。是一种发掘数据和数据集紧张特性的一种方法。
E字节(EB: Exabytes) – 约即是 1000 PB(petabytes), 约即是 1 百万 GB。如今环球每天所制造的新信息量大约为 1 EB。
提取-转换-加载(ETL: Extract, Transform and Load) – 是一种用于数据库或者数据仓库的处理过程。即从各种不同的数据源提取(E)数据,并转换(T)成能知足业务须要的数据,末了将其加载(L)到数据库。
# F #
Fluent – 一种可随韶光变革的条件。
故障切换(Failover) – 当系统中某个做事器发生故障时,能自动地将运行任务切换到另一个可用做事器或节点上。
容错设计(Fault-tolerant design) – 一个支持容错设计的系统该当能够做到当某一部分涌现故障也能连续运行。
# G #
游戏 AI(Game AI)– 利用算法替代随机性的一种适用于游戏的AI特定形式。这种打算行为用于非玩家角色(NPC),对付玩家的操作天生类似人类的智力和基于反应的行为。
图形数据库(Graph Databases) – 利用图形构造(例如,一组有限的有序对,或者某种实体)来存储数据,这种图形存储构造包括边缘、属性和节点。它供应了相邻节点间的自由索引功能,也便是说,数据库中每个元素间都与其他相邻元素直接关联。
网格打算(Grid computing) – 将许多分布在不同地点的打算机连接在一起,用以处理某个特定问题,常日是通过云将打算机相连在一起。
# H #
Hadoop – 一个开源的分布式系统根本框架,可用于开拓分布式程序,进行大数据的运算与存储。
Hadoop数据库(HBase) – 一个开源的、非关系型、分布式数据库,与Hadoop框架共同利用。
HDFS – Hadoop分布式文件系统(Hadoop Distributed File System),是一个被设计成适宜运行在通用硬件(commodity hardware)上的分布式文件系统。
# I #
内存数据库(IMDB: In-memory) – 一种数据库管理系统,与普通数据库管理系统不同之处在于,它用主存来存储数据,而非硬盘。其特点在于能高速地进行数据的处理和存取。
物联网(Internet of Things) – 在普通的设备中装上传感器,使这些设备能够在任何韶光任何地点与网络相连。
# J #
法律上的数据同等性(Juridical data compliance) – 当你利用的云打算办理方案,将你的数据存储于不同的国家或不同的大陆时,就会与这个观点扯上关系了。你须要留神这些存储在不同国家的数据是否符合当地的法律。
# K #
键值数据库(KeyValue Databases) – 数据的存储办法是利用一个特定的键,指向一个特定的数据记录,这种办法使得数据的查找更加方便快捷。键值数据库中所存的数据常日为编程措辞中基本数据类型的数据。
知识工程(Knowledge engineering)– 侧重于建立以知识为根本的系统,包括科学、技能和社会在内的所有方面。
# L #
延迟(Latency) – 表示系统韶光的延迟。
负载均衡(Load balancing) – 将事情量分配到多台电脑或做事器上,以得到最优结果和最大的系统利用率。
位置信息(Location data) – GPS信息,即地理位置信息。
日志文件(Log file) – 由打算机系统自动天生的文件,记录系统的运行过程。
# M #
M2M数据(Machine2Machine data) – 两台或多台机器间互换与传输的内容。
机器数据(Machine data) – 由传感器或算法在机器上产生的数据。
机器智能(Machine intelligence)– 涵盖机器学习、深度学习和古典学习算法在内的总括术语。
机器感知(Machine perception)– 系统吸收和解释来自外部天下数据的能力,类似于人类利用感官。这常日须要借助外接硬件完成,只管软件也同样须要。
机器学习(Machine learning) – 人工智能的一部分,专注于算法,许可机器在不经由编程的情形下学习,并随着新数据的摄入而改变。
MapReduce – 是处理大规模数据的一种软件框架(Map: 映射,Reduce: 归纳)。
大规模并行处理(MPP: Massively Parallel Processing) – 同时利用多个处理器(或多台打算机)处理同一个打算任务。
元数据(Metadata) – 被称为描述数据的数据,即描述数据数据属性(数据是什么)的信息。
MongoDB – 一种开源的非关系型数据库(NoSQL database)。
多维数据库(Multi-Dimensional Databases) – 用于优化数据联机剖析处理(OLAP)程序,优化数据仓库的一种数据库。
多值数据库(MultiValue Databases) – 是一种非关系型数据库(NoSQL), 一种分外的多维数据库:能处理 3 个维度的数据。紧张针对非常长的字符串,能够完美地处理 HTML 和 XML 中的字串。
# N #
自然措辞处理(Natural Language Processing) – 是打算机科学的一个分支领域,它研究如何实现打算机与人类措辞之间的交互。
网络剖析(Network analysis) – 剖析网络或图论中节点间的关系,即剖析网络中节点间的连接和强度关系。
NewSQL – 一个优雅的、定义良好的数据库系统,比 SQL 更易学习和利用,比 NoSQL 更晚提出的新型数据库。
NoSQL – 顾名思义,便是“不该用 SQL ”的数据库。这类数据库泛指传统关系型数据库以外的其他类型的数据库。这类数据库有更强的同等性,能处理超大规模和高并发的数据。
# O #
工具数据库(Object Databases) – (也称为面象工具数据库)以工具的形式存储数据,用于面向工具编程。它不同于关系型数据库和图形数据库,大部分工具数据库都供应一种查询措辞,许可利用声 明式编程(declarative programming)访问工具。
基于工具图像剖析(Object-based Image Analysis) – 数字图像剖析方法是对每一个像素的数据进行剖析,而基于工具的图像剖析方法则只剖析干系像素的数据,这些干系像素被称为工具或图像工具。
操作型数据库(Operational Databases) – 这类数据库可以完成一个组织机构的常规操作,对商业运营非常主要,一样平常利用在线事务处理,许可用户访问 、网络、检索公司内部的详细信息。
优化剖析(Optimization analysis) – 在产品设计周期依赖算法来实现的优化过程,在这一过程中,公司可以设计各种各样的产品并测试这些产品是否知足预设值。
本体论(Ontology) – 表示知识本体,用于定义一个领域中的观点集及观点之间的关系的一种哲学思想。(数据被提高到哲学的高度,被授予了天下本体的意义,成为一个独立的客不雅观数据天下)。
非常值检测(Outlier detection) – 非常值是指严重偏离一个数据集或一个数据组合总均匀值的工具,该工具与数据集中的其他它相去甚远,因此,非常值的涌现意味着系统发生问题,须要对此另加剖析。
# P #
模式识别(Pattern Recognition) – 通过算法来识别数据中的模式,并对同一数据源中的新数据作出预测。
P字节(PB: Petabytes) – 约即是 1000 TB(terabytes), 约即是 1 百万 GB (gigabytes)。欧洲核子研究中央(CERN)大型强子对撞机每秒产生的粒子个数就约为 1 PB。
平台即做事(PaaS: Platform-as-a-Service) – 为云打算办理方案供应所有必需的根本平台的一种做事。
预测剖析(Predictive analysis) – 大数据剖析方法中最有代价的一种剖析方法,这种方法有助于预测个人未来(近期)的行为,例如某人很可能会买某些商品,可能会访问某些网站,做某些事情或者 产生某种行为。通过利用各种不同的数据集,例如历史数据,事务数据,社交数据,或者客户的个人信息数据,来识别风险和机遇。
公共数据(Public data) – 由公共基金创建的公共信息或公共数据集。
# Q #
数字化自我(Quantified Self) – 利用运用程序跟踪用户一天的一举一动,从而更好地理解其干系的行为。
# R #
循环神经网络(RNN)– 一种理解顺序信息、识别模式、并根据这些打算产生输出的神经网络。
再识别(Re-identification) – 将多个数据凑集并在一起,从匿名化的数据中识别出个人信息。
回归剖析(Regression analysis) – 确定两个变量间的依赖关系。这种方法假设两个变量之间存在单向的因果关系(自变量,因变量,二者不可互换)。
RFID – 射频识别,这种识别技能利用一种无线非打仗式射频电磁场传感器来传输数据。
实时数据(Real-time data) – 指在几毫秒内被创建、处理、存储、剖析并显示的数据。
推举引擎(Recommendation engine) – 推举引擎算法根据用户之前的购买行为或其他购买行为向用户推举某种产品。
路径剖析(Routing analysis) – 针对某种运输方法通过利用多种不同的变量剖析从而找到一条最优路径,以达到降落燃料用度,提高效率的目的。
# S #
半构造化数据(Semi-structured data) – 半构造化数据并不具有构造化数据严格的存储构造,但它可以利用标签或其他形式的标记办法以担保数据的层次构造。
情绪剖析(Sentiment Analysis) – 通过算法剖析出人们是如何看待某些话题。
监督学习(Supervised learning)– 机器学习的一种,其输出数据集演习机器产生所需的算法,如老师监督学生;比无监督学习更常见。
群体行为(Swarm behavior)– 从数学建模者的角度来看,这是从个体遵照的大略规则衍生出的新生行为,不涉及任何集中折衷。
相似性搜索(Similarity searches) – 在数据库中查询最相似的工具,这里所说的数据工具可以是任意类型的数据。
智能网格(Smart grid) – 是指在能源网中利用传感器实时监控其运行状态,有助于提高效率。
软件即做事(SaaS: Software-as-a-Service) – 基于Web的通过浏览器利用的一种运用软件。
空间剖析(Spatial analysis) – 空间剖析法剖析地理信息或拓扑信息这类空间数据,从中得出分布在地理空间中的数据的模式和规律。
SQL – 在关系型数据库中,用于检索数据的一种编程措辞。
构造化数据(Structured data) -可以组织成行列构造,可识别的数据。这类数据常日是一条记录,或者一个文件,或者是被精确标记过的数据中的某一个字段,并且可以被精确地定位到。
# T #
T字节(TB: Terabytes) – 约即是 1000 GB(gigabytes)。1 TB容量可以存储约 300 小时的高清视频。
时序剖析(Time series analysis) – 剖析在重复丈量韶光里得到的定义良好的数据。剖析的数据必须是良好定义的,并且要取自相同韶光间隔的连续韶光点。
拓扑数据剖析(Topological Data Analysis)– 拓扑数据剖析紧张关注三点:复合数据模型、集群的识别、以及数据的统计学意义。
交易数据(Transactional data) – 随韶光变革的动态数据。
透明性(Transparency) – 消费者想要知道他们的数据有什么浸染、被作何处理,而组织机构则把这些信息都透明化了。
# U #
非构造化数据(Un-structured data) – 非构造化数据一样平常被认为是大量纯文本数据,个中还可能包含日期,数字和实例。
无监督学习(Unsupervised learning)– 一种机器学习算法,通过不带标签相应的输入数据组成的数据集进行推理。最常见的无监督学习方法是聚类剖析。
# V #
代价(Value) – (大数据 4V 特点之一) 所有可用的数据,能为组织机构、社会、消费者创造出巨大的代价。这意味着各大企业及全体家当都将从大数据中获益。
可变性(Variability) – 也便是说,数据的含义总是在(快速)变革的。例如,一个词在相同的推文中可以有完备不同的意思。
多样(Variety) – (大数据 4V 特点之一) 数据总是以各种不同的形式呈现,如构造化数据,半构造化数据,非构造化数据,乃至还有繁芜构造化数据。
高速(Velocity) – (大数据 4V 特点之一) 在大数据时期,数据的创建、存储、剖析、虚拟化都哀求被高速处理。
真实性(Veracity) – 数据的精确性。组织机构须要确保数据的真实性,才能担保数据剖析的精确性。
可视化(Visualization) – 只有精确的可视化,原始数据才可被投入利用。这里的“可视化”并非普通的图型或饼图,可视化指是的繁芜的图表,图表中包含大量的数据信息,但可以被很随意马虎地理解和阅读。
大量(Volume) – (大数据 4V 特点之一) 指数据量,范围从Megabytes至Brontobytes。
# X #
XML数据库(XML Databases) – XML 数据库是一种以XML格式存储数据的数据库。XML 数据库常日与面向文档型数据库干系联,开拓职员可以对XML 数据库的数据进行查询,导出以及按指定的格式序列化。
# Y #
Y字节 (Yottabytes) – 约即是 1000 ZB (Zettabytes),约即是 250 万亿张 DVD 的数据容量。现今,全体数字化宇宙的数据量为 1 YB,并且将每 18 年翻一番。
# Z #
Z字节 (ZB: Zettabytes) – 约即是 1000 EB (Exabytes), 约即是 1 百万 TB。
任何遗漏之处
欢迎留言补充~
-END-
干系阅读【工业机器人】环球工业机器人详细家当链梳理!
【智能工厂】智能工厂如何快速落地
【工业技能】航空制造推动新观点机器人发展(上)
【工业技能】航空制造推动新观点机器人发展(下)
一文读懂人脸识别技能
【AI】一文读懂机器学习、数据科学、人工智能、深度学习和统计学之间的差异
【深度学习】12张高清思维导图,总结深度学习
【神经网络】给初学者们讲解人工神经网络(ANN)
人工智能的根本--知识分类
人工智能家当链深度透析—根本层
人工智能家当链深度透析-技能层
人工智能百口当链深度透析--(综合)
人工智能家当链深度透析—家当运用医疗篇
朱松纯 | 人工智能的现状、任务、构架与统一(上)
朱松纯 | 人工智能的现状、任务、构架与统一(中)
朱松纯 | 人工智能的现状、任务、构架与统一(下)
【AI】美国国家人工智能研发计策方案2019
【聪慧农业】2018中国农牧家禽行业聪慧养殖白皮书
【聪慧农业】2019年聪慧农业市场调研及前景研究报告(附PDF下载)
【智能家居】我国智能锁家当现状及未来发展趋势剖析
【知识图谱】详解知识图谱关键技能与运用、AI图谱技能在知乎的运用实践、如何构建多快好省的“知识图谱即做事”
荐:
【中国风动漫】除了《哪吒》,这些良心国产动画也该当被更多人知道!
声明
免责声明:部分文章和信息来源于互联网,不代表本订阅号赞许其不雅观点和对其真实性卖力。如转载内容涉及版权等问题,请立即与
编辑:Zero
重大
!
招募志愿者:
长期招募志愿者,参与文章创作、微信群掩护、文章排版等事情,有助于拓展个人影响力,请留言与我们联系。
点击
“阅读原文“
立即加入同盟!
留下信息,事情职员联系你哦~
文末福利
1.赠予800G人工智能资源。
获取办法:关注本"大众年夜众号,回答“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取办法:关注本"大众年夜众号,回答“公开课”。
3.免费微信互换群:
人工智能知识分享群、
智能机器人互换论坛、
人工智能厂家互换群、
AI家当链做事互换群、
STEAM创客教诲互换群、
人工智能技能论坛、
人工智能未来发展论坛、
AI企业家互换俱乐部
雄安企业家互换俱乐部
细分领域互换群:
【智能家居系统论坛】【聪慧城市系统论坛】【智能医调理老论坛】【自动驾驶家当论坛】【聪慧金融互换论坛】【聪慧农业互换论坛】【无人翱翔器家当论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教诲机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】
入群办法:关注本公众号,回答“入群”