文档库 最新最全的文档下载
当前位置:文档库 › 2013-机器学习面临的挑战(张长水)

2013-机器学习面临的挑战(张长水)

2013-机器学习面临的挑战(张长水)
2013-机器学习面临的挑战(张长水)

中国科学院学部科学与技术前沿论坛

信号与信息处理专刊

中国科学:信息科学2013年第43卷第12期:1612–1623

https://www.wendangku.net/doc/cf10309959.html, https://www.wendangku.net/doc/cf10309959.html, 机器学习面临的挑战

张长水

清华大学自动化系,智能科学与技术国家重点实验室,清华信息科学与技术国家实验室(筹),北京100084

E-mail:zcs@https://www.wendangku.net/doc/cf10309959.html,

收稿日期:2013–06–20;接受日期:2013–11–13

国家重点基础研究发展计划(批准号:2013CB329503)和国家自然科学基金(批准号:91120301,61075004)资助项目摘要该文讨论了机器学习目前面临的几个挑战,包括:高维特征空间和数据量问题,大数据量的计算困难,寻求最优解的困难和可解释性差等问题.然后针对当前很多人关心的几个重要问题,例如大数据问题,深度学习,概率图模型等做了分析,以引起深入思考.

关键词机器学习深度学习概率图模型大数据优化问题

1引言

过去的二十多年的时间里,机器学习的研究得到了快速发展,取得了一系列令人瞩目的研究成果,同时也面临很多的挑战.我们需要对机器学习的现状和面临的挑战进行探讨和梳理,以引起更深入的思考.

2机器学习面临的挑战

虽然机器学习取得了令人瞩目的成果,但是仍然面临很多困难和问题.下面列举其中的一些问题.

2.1高维特征空间与样本数的不足

在很多实际应用问题中,得到的特征维数是比较高的,有的甚至是非常高的.例如,在图像识别中如果提取SIFT 特征,特征维数是128维,如果提取其他特征,维数也往往是几十维,或者几百维.还有,在文本分类问题中,如果把每一个单词当作一个特征,特征的维数可能是几千维,或者上万维,这依赖于所使用的字典大小.

下面以概率密度函数的估计为例讨论特征维数和所需要的样本之间的关系.对于一维的概率密度函数估计来说,通常在具有几十个以上的样本时可以得到一个比较好的函数估计,这是因为在每一个点附近应该有一定量的样本(也就是说,数据要具有一定的密度)才能得到好的估计结果.我们假设至少需要10个样本,这是一个保守的数字.如果要估计的是一个二维概率密度函数,就需要把二维空间等分成一些小网格,需要每一个小网格中有足够多的样本.因此,可能需要102=100个样本.当维数增加的时候,空间中小的格子的数量随维数的增加而指数上升.假设维数为d ,需要的样本数是10d .

中国科学:信息科学第43卷第12期

按照这种方法计算,在图像识别问题中,至少需要10100个样本,而在文本分类中,需要101000个以上的样本.可我们知道,这是不可能的一件事情.

由于样本数不足导致了高维数据学习的困难,这个现象被称作“维数灾难”.维数灾难的核心问题是,高维函数实事上远比低维函数复杂,而我们对其还没有有效的方法进行分析.

利用具体分类问题的先验知识,或者利用得到的训练数据,可能在一定程度上减少维数灾难带来的困难.例如,如果知道两组特征x和y之间是独立的,那么就有

p(x,y)=p(x)p(y).(1)

因此,对于p(x,y)的估计就可以通过分别对p(x)和p(y)估计来完成.由于单独的x或y的维数要小于它们联合在一起的(x,y)的维数,因此,所需要的样本数就会少很多.概率图模型[1]研究的就是如何利用随机变量之间的条件独立性对问题建模、学习、推理的理论、算法和应用.概率图模型在解决高维样本学习方面有很多贡献.

另外,对实际问题中的数据分析表明,大量的实际问题的高维数据实际上嵌入在一个低维的流形上[2,3],也就是说,数据并没有充满整个高维空间.其主要原因就是各个特征之间存在很强的相关性.因此,实际上并不需要那么多的数据来估计概率密度函数.尽管如此,目前的研究表明,图像数据的本质维数至少有几十维,这对样本数的需求还是非常大的.

上面讨论的维数对样本量的需求是以非参数概率密度函数估计为例.实际上,维数灾难不仅仅出现在概率密度函数的估计中,也存在于其他的学习问题中.上面谈到的特征独立和流形分布的知识同样有助于缓解在其他学习问题中遇到的维数灾难困难.

2.2寻找最优解的困难

目前很多的机器学习研究沿着这样的思路进行:把要解决的问题形式化为一个目标函数,然后通过优化这个目标函数达到对数据学习的目的.例如:支持向量机就是把要解决的两类分类问题形式化为最小化如下目标函数:

f(w)=1

2

w T w+C

N

i=1

L(w,x i,y i).(2)

其中x i,y i(i=1,...,N)是样本的特征和标签,N是样本个数,w是线性分类器的权向量,L是损失函数,C是折衷系数.当L是二次,或者一次函数时,函数f是一个凸函数,存在一个极值,可以通过凸优化算法寻优.

我们要解决的实际问题非常复杂,将其形式化后的目标函数也非常复杂,往往在目前还不存在一个有效的算法能找到这样复杂目标函数的最优值.因此,需要通过一些优化技术寻找次优值.这样做通常有两个方面的问题存在,一个是所使用的优化技术可能非常复杂费时,效率很低;另一个是得到的局部极值可能距离我们希望的解很远,不能满足要求.

机器学习领域中有一些优化问题具有一些特殊性.因此,有一些研究工作集中在如何求解这些优化问题以及分析所得到的解的性能分析.但是,为了解决机器学习领域的问题,研究针对性的有效优化算法是必要的.

由于求解全局最优是非常困难的,所以,通常人们只是采用简单的局部极值求解算法,例如梯度下降方法.采用局部极值算法时,当算法的初值不同,得到的解也不同.而要优化的函数往往有非常多

1613

张长水:机器学习面临的挑战

(可能成千上万,或者更多)的局部极值,通过算法得到的解只是其中一个.我们会关心下面的问题:这么多的局部极值都是我们所希望的解吗?如果不是,其中哪些局部极值是?如何得到这些解?

另外,在对要解决的问题建模时,目标函数有时候只是一种“近似”的建模.例如:把要解决的问题形式化成优化下面的函数:

f(w)=L(w)+C×r(w).(3)其中L(w)是损失函数,r(w)是正则项,C是折衷系数.目前经常使用的正则项有很多,例如:光滑性正则函数,稀疏性正则函数,函数复杂性正则函数.光滑性正则函数假设函数具有光滑性质;稀疏性正则函数假设要学习的模型具有稀疏性;函数复杂性正则函数则要求要学习的函数不能太复杂.这些正则函数的使用基础是假定所要研究的问题满足这样的条件.但是实际问题是否满足,在什么程度上满足这样的条件,我们并不知道.目标函数的这种“近似”性质,需要考虑下面这些问题,一定需要求解目标函数的全局最优值吗?局部极值(全部局部极值都)能满足要求吗?

2.3可解释性差

从上文的讨论中可知,机器学习领域里要解决的问题很难用一个容易优化的函数来建模.对于一个实际问题,可以构建不同的目标函数来表示要解决的同一个问题.这样,也就会得到很多不同的解.

机器学习的另一个问题是得到的模型的可解释性差.可解释性是和实际应用密切相关的.机器学习在解决一些具体的问题时,需要领域的专家能够理解模型,能够理解“为什么”这个模型能够对未知样本做预测.例如,在分子生物学的蛋白质结构分析中,一个只在输入输出意义下对数据是正确的模型对于分子生物学家还远远不够.他们需要获得的模型在分子生物学意义下可解释.同时,由于所提供的训练数据是不充分的,机器学习还需要为他们提供进一步工作的线索和可能.他们需要的是可解释的数据理解工具或工具集.

机器学习应该考虑模型对问题世界的可解释性.机器学习一直以来所遵循的“输入输出满足”原则对某些问题而言可能是远远不够了.正如上文所讨论的,在求解机器学习问题时可能得到多个解,如果使用“输入输出满足”原则,可能建立的多个模型获得多个解,则需要以对问题世界可解释性来分辨其优劣.

大数据时代一书[4]强调了在大数据时代相关关系的发现和使用更为重要,而不应该那么追求因果关系.我认为,在某些商业领域他们这样做是对的.但是当我们关注科学问题时,情况就会不同.寻根溯源,或者说追求因果关系是科学研究的一个动力.

关于因果关系和相关关系,马颂德老师给了意见:“因果关系是一个相对的概念”.对此的一个解释是:“牛顿看到苹果掉在地上,发现了万有引力定理,可以说发现了苹果掉在地上的因果关系.但也可以说,这是个相关关系,因为它没有说明万物之间为什么有引力.”

可以说,大数据时代一书更强调相关关系,而我们的科学研究更强调因果性.就机器学习而言,因不同的应用问题不同,对因果关系的需求程度也是不同的.对于更商业化的应用问题,即在输入输出意义下对数据是正确的,可预测性非常重要.而对于更基础的科学研究问题而言,可解释性就更为重要.

2.4大数据量的计算

这里讨论的是数据量这样一个问题,而不是大数据时代一书中谈到的大数据问题.下文会讨论大数据问题.

1614

中国科学:信息科学第43卷第12期

数据量大是机器学习在应用阶段面临的重要问题.实际上,在机器学习领域近些年一直关注这个问题,被称之为“大规模数据的学习”(large scale data learning,或big learning).

在过去的十几年中,人们关注的更多的是好的机器学习算法的设计,学习算法的性能分析等,我们统称为学习理论和学习方法.这是因为当时有太多的问题需要研究和解决,而机器学习的突飞猛进,吸引了大部分研究人员的注意力,很多人沉浸在机器学习的理论方法研究的喜悦中.而当学习理论和学习方法都已经建立,几个有代表性的学习算法在实际问题中成功应用后,大规模数据的学习开始成为了一个受到关注的问题.

大规模数据的学习之所以在近几年才开始受到关注,主要是因为实际中数据量很大.而十几年来发展起来的很多学习算法面临的一个尴尬就是:都很难用于大数据的学习,主要的问题是时间复杂性和空间复杂性.例如:当训练数据超过10000时,支持向量机算法代码(libsvm)因为内存不够而无法在一台普通的台式机上运行,即使扩大内存后,也需要几个小时才能完成训练.因此,不能想象训练数据是十万、百万量级下的支持向量机的学习(而libsvm计算复杂度是样本量的平方).类似的情况也出现在其他的一些机器学习算法中,如:EM算法、主成分分析、线性判别、聚类算法.因此,出现了一些工作来解决这个问题.其基本思路有下面几个:

?快速算法.即与原算法等价的快速算法,类似于为傅里叶变换找到快速傅里叶变换的工作.这样的工作无疑是重要的,但是其存在加速极限.

?近似算法.不是所有的算法都可以很容易找到和原算法等价的非常快速的算法.因为要求速度快,因此就考虑在牺牲很少的精确性的情况下寻找非常快速的(例如线性的,或者是亚线性的)算法.在这里牺牲精确度是很有必要.机器学习很多年以来一直在追求学习模型的泛化能力,但是,模型的泛化能力取决于很多因素,而不仅仅是学习算法.当样本数很大的时候,其带来的泛化能力的提高往往更有意义.而对于一些聚类问题而言,聚类问题通常只是用于所研究问题的一个阶段,其精度并没有那么重要.因此,这里牺牲精度就是一个自然的选择.当然,近似算法的设计也是存在加速极限.

?增量学习和在线学习(incremental learning,online learning).这两种学习方式是在一些应用条件具备的情况下进行大数据量学习的一个解决方案.当需要解决的实际问题的数据是序贯到达的,就可以考虑增量学习和在线学习.增量学习和在线学习考虑的是,当新的样本到达时,是否可以对已经学习到的模型进行小的调整而达到学习的目的.这里的小意味着少的计算量.和增量学习一个重要的不同在于,在线学习要求的“小的调整”能够实时完成.有些算法本身的性质决定了可以比较容易设计出其增量学习算法,例如:感知器学习算法、EM算法等.而有的算法则难度更大些,例如:支持向量机、主成分分析.增量学习和在线学习近些年受到重视,这方面有些优秀的工作发表.

?并行算法.利用更多的计算资源以解决大数据的学习问题.人们考虑过把机器学习算法进行各种并行方案的执行.例如:单机多核并行、GPU方案、多服务器方案等.一些大的计算机公司更关注这方面的工作.例如:有计算机公司曾设法把主成分分析、高斯混合模型的学习算法在1万台服务器上并行实现.这个的工作思路无疑是诱人的.但是由于通讯开销,各个计算单元之间的同步等问题的存在,并行算法这个方向的工作并没有那么理想的进展.其并行算法的计算能力并不能和所利用的服务器数量呈线性关系,甚至亚线性关系也达不到.更多的情况是,当服务器达到一定数量后,计算能力几乎不再增长,见图1.当然,已经有研究者着手解决这个问题.

在大规模数据的计算方面有一些很好的研究工作发表.有些研究工作解决的问题非常吸引人,例如:如果训练数据不能一次放到内存怎么办?有些算法的加速结果很诱人.例如:把最大间隔聚类算法的原算法(计算复杂度O(n7),n是样本数)加速到O(sn)[5],s是高维数据的稀疏度.

1615

张长水:机器学习面临的挑战

图1当前的机器学习算法能够学习的数据量和并行机器数量的关系.横轴表示并行机器的数据,纵轴表示可以处理的数据量.理想情况下,这是一个线性关系x=y,但实际上是另一曲线,即机器数目到达一定量后,可以处理的数据

量几乎不再增长

Figure1Relation between data handling capacity and number of parallel unit in a parallel machine learning system recently.In ideal conditions,it follows a linear relationship x=y,but actually the data-handling capacity hardly increases when parallel units achieve a certain number

值得说明的是,并非数据量一定要非常大才叫做大数据的学习问题.从算法角度看,只要数据量大,解空间(模型空间、参数空间)就极其大.因此,做机器学习研究的人对大数据的体会更深,压力更大.

3几个重要问题

除了上面讨论的机器学习面临的挑战外,下面一些问题也很重要.

3.1大数据

大数据是当前一个热点问题[4].大数据涉及很多方面的研究,这包括:数据的获取、传输、存储、分析等.这里主要讨论大数据给机器学习的挑战和机遇.

这里的所说的大数据主要是针对由于互联网等技术的发展而出现的大数据问题,而不仅仅是指数据量比较大(大数据量的学习已经在前面讨论过了).这里的“大数据”一词代表了:数据多,不够精确,数据混杂,自然产生等特点,这些都在文献[4]中做了总结.

大数据给机器学习带来的问题不仅仅是因为数据量大而计算上非常困难,其带来的更大的困难在于:数据可能是在不同的服务器上获取的,这些分布在不同服务器上的数据之间存在某些联系,但是基本上不满足同分布的假设,而我们也不可能把所有数据集中起来进行处理和学习.经典的机器学习理论和算法要求数据是独立同分布的.当这个条件不满足时,这时我们的学习模型和学习算法怎么办?是修改算法从这些数据中学习,还是整理数据以适应目前的学习算法?这些服务器上的数据之间的关系如何建模和分析?另外,我们已经知道,在网络上获取的很多数据的分布通常会随着时间的推移发生变化(称之为演化数据,在网络的论坛中称之为概念漂移),这时我们的学习模型和学习算法怎么办?

1616

中国科学:信息科学第43卷第12期

在数据分布发生变化时,数据的独立同分布的假设也不再满足,这时还有什么数学性质可以满足?如果不满足任何的数据性质或者可以利用的数学性质很少,其依赖的数学理论是什么?如何确定给出的模型和算法是可靠的,而不仅仅是实验室里的算法游戏呢?

大数据除了给机器学习带来了计算上的困难和挑战外,也带来了一些好处.其中一个好处体现在数据多了以后,呈现出小数据情况下没有呈现出的现象,这被称之为“涌现”(emergence).实际上,1990年后曾经有几年人们很集中的研究过这个问题.人们发现:“微观”地了解每一个个体,并不能预测“宏观”的整体行为.例如:我们知道每个水分子的运动规律和运动方程,但是你无法知道水的沸腾是什么样子,沸腾的水是“涌现”出来的现象.在应用领域,研究人员曾经仅仅使用三条规则来描述一只鸟的飞行.这样当一群鸟的每一个个体都仅仅遵循这三条规则飞行时,就“涌现”出看到过的鸟在天空翱翔的景象.“涌现”一词很生动表达了这一含义.人们也做过很多类似的实验证明了这一点.因此,出现了被称之为群体智能(collective intelligence,wisdom of the crowd)这样的术语.当然,机器学习研究领域对此研究不多.

大数据的另一个好处是:在某些应用条件下,数据变得稠密了.多年以来,因为很多众所周知的原因机器学习一直在研究小样本的学习问题.在实际中,分类器性能不够好的一个原因就是样本太少.理论上,我们知道在样本数趋于无穷的时候,很多算法具有很多良好的性质.实践中也有这样的体会,当样本数很多时,使用简单的模型往往能够取得好的泛化性能.而在大数据时代,当样本数量很大的时候,在样本空间的某些区域会出现稠密的现象,这些稠密的数据给分类器设计实际上提供了很多的信息.因此,在这些局部稠密区域,分类器的性能有可能接近理论上的极限性能.

大数据的再一个好处是:大数据使得样本空间原来“空旷”的区域出现了样本,原来“稀疏”的区域变得不再稀疏,这在很大程度上为提高分类器性能提供了很好的数据基础.直观地说,就是数据本身的多样性能够更多的展现出来.例如:在语音识别问题中,大数据情况下,人们各种的发音习惯才能更多地体现出来;在图像识别中,大数据情况下,物体在不同情况(变形、光照、背景等变化)下的外观表现才更丰富.而这些数据的缺失很难通过建模和学习算法弥补,同时,这些数据也很难(可以说是不可能)通过专家、算法设计人员的设计来获取.因此数据产生的自发性就很重要.

正是基于上面的原因,很多从事语音识别的研究人员希望在尽可能多的数据上进行训练:从几个小时,到几十个小时,到几百个小时,乃至几万个小时的语音数据;计算机视觉的研究人员也在尽可能多的收集和标注数据:从几万,到几十万,到Fei-Fei Li的八千万图像数据[6],到几百亿乃至几千亿的语音数据.八千万图像的ImageNet的建立是一个了不起的工作,然而这些数据对于计算机视觉的任务还远远不够.而事实上,Hinton在使用ImageNet图像进行物体识别[7]训练时,把每张图像进行了很多微小的变换(旋转、光照变化等)从而生成了比原图像多几倍,十几倍的训练数据情况下,识别率又提高了几个百分点.这充分说明了我们的训练数据在通常情况下还很不够.

大数据时代数据的自发性导致了数据本身的不精确性.不精确意味着数据有错误.和传统的精确标注的数据相比,不精确是一个大问题.而实际上,对于不精确性的一个补偿就是大量的数据,由于数据量的巨大,这一问题变得没有那么严重,因为其中还有很多高质量的数据.

在机器学习领域几乎没有对这种数据的不精确性做过工作.可能是因为统计机器学习方法已经对噪声进行了建模,这噪声也可以包含数据的不精确性.另外,针对某些实际应用中的不精确性很难建模,所以分析算法的性能就太困难.

相比机器学习领域,数据挖掘领域对此有过一些研究工作.这些研究工作讨论了当标注数据存在错误时,是否能够构建好的分类器.基本结论是:当大部分标注数据是正确的时候,少数(小于50%)

1617

张长水:机器学习面临的挑战

的错误标注样本对分类器的影响不大,错误标注数据的比例越小,分类器的准确性越高[8].当然,如果大部分标注样本存在错误时怎么办?对于某些具体的应用问题,当数据量很大的时候,可以有针对性地设计算法解决这个问题.我们曾经考虑一种特殊情况,在这种情况下,即使大部分标注数据是错误的,仍然可以设计出好的分类器[9].

看起来不精确性对机器学习是个不利的方面,而实际上,它并非全是坏处.例如:在互联网上搜索时,百度和google会给出一些检索结果.当用户看到这些结果时,会点击其中的一条,然后也许会再点击另外一条.这些点击信息告诉我们,用户点击的第一条可能不是他要找的网页,或者第二条让他更满意.这些点击信息虽然没有明确做好网页和查询数据之间的标注,但是告诉我们一些可能的信息.这样的数据如果足够多,就有利用价值.一些研究组报告说,这些“弱标注”数据给他们的系统提供了很多有用的信息,而改进了他们的系统.

混杂性是大数据的另一个特性,是因为数据是自发生成的而带来的一个特性.混杂性给我们提出的一个课题就是要把这些数据进行分离和整理,从而为进一步的机器学习做准备.这个过程是数据挖掘要完成的任务.

3.2深度学习

在上个世纪八十年代和九十年代,反向传播算法(BP算法)的出现使得人工神经网络的研究东山再起,得到了很大的重视和快速发展.然而经过几年的快速发展后,又迅速进入研究的低谷.

2006年Hilton发现了深层神经网络的学习算法[10].这之后,人工神经网络又逐渐得到了重视,成为近年来的研究热点.

人工神经网络的这次东山又起,以一个新的面貌出现:深度学习.这里的深度指网络的层数多.二十年前的神经网络研究的大多是三层的神经网络:一个输入层,一个隐含层,一个输出层.反向传播算法的出现让多层神经网络的学习成为可能.当时出现了很多令人振奋的研究成果,其中一个就是关于多层神经网络的表达能力的结果[11]:只含有一个隐层的前馈网络是一个通用的函数逼近器,在一定条件下,它可以逼近任何一个连续函数.这个结果说明有一个隐层的前馈网络对于表达非线性函数来说已经足够,当然这并不说明一个隐层是最好的.也有研究结果表明,要逼近相同输入维数的函数,两个隐层的网路可能比单个隐层的网络所需隐单元数要少得多.尽管如此,因学习算法不令人满意,很少有人使用两层以上的神经网络结构.大量的研究表明,反向传播算法严重过学习(over?tting).毫无疑问,反向传播算法是一个贪婪优化算法,其收敛到目标函数的一个局部极值.而目标函数是一个非凸的复杂的目标函数,存在大量的局部极值.看起来,其中很多的局部极值不是我们想要的结果,而我们又无法提前选择一个好的初值通过反向传播算法得到理想的局部极值.样本量太少也是导致神经网络严重过学习的一个重要原因.当时人们没有使用那么多样本有很多原因.一个是获取足够的样本的代价太高,另外,计算能力的不足也限制了人们对于大样本量学习的探索.因此,探讨一个以上的隐含层的学习的研究工作非常少,发表的一些研究工作也不让人乐观.

而这次深度学习的出现是通过逐层学习的方式解决了多个隐含层神经网络的初值选择问题.图2给出的是一个具有三个隐含层的逐层监督学习示意图.不仅如此,研究工作表明,非监督数据在多个隐含层神经网络的初值学习中也起到了很重要的作用.这是一个很有意思的结果.在监督学习中,需要具有样本标号的监督数据.然而,获取大量标注的样本的代价过于昂贵.例如:语音信号数据库、图像数据库的建立工作都说明了这一点.但是,如果不要求数据是监督的,其数据获取代价就小得多.例如:获取大量的语音信号较为容易,因为每个人每天要说很多话,也可以从电视、广播中得到这些语音

1618

中国科学:信息科学第43卷第12期

图2具有三个隐含层的逐层监督学习示意图,每一个方块表示一个隐含层.逐层的学习过程是:从输入到临时的输出节点y1构成一个单隐含层网络,学习该隐含层;然后以该隐含层样本为输入,把下一层的隐含层和临时输出y2构成一个单隐含层网络,学习该第二个隐含层.这样一直下去直到所有隐含层的学习结束

Figure2Sketch map of a layer-by-layer supervised learning process with3layers,in which each rectangle represents a hidden layer.The learning process is as follow:the input node and temple output node y1form a single hidden layer network.We learn this layer and use its output as input for the next hidden layer and its temple output node y2,which can also be seen as a single hidden network.We can go on learn in this way until we complete each hidden layer

信号.另外也可以在网络上收集大量的图像,或者通过手机、照相机拍摄大量的图像.非监督数据也可以用来通过类似监督的逐层学习方式解决多个隐含层神经网络的初值选择问题.

仔细研究可以知道,深层网络的逐层学习方法是个非常“粗糙”的学习方法,这其中有太多的近似.不过,这个学习过程给我们一些启示:虽然这是个非常近似的算法,但是却能得到如此好的泛化能力.这是什么原因?

另外,近些年深度学习的研究表明,深层网络的隐含节点学习到的是所研究问题的特征.这和机器学习、模式识别之前的研究非常不同.传统的研究中,特征提取都是领域专家的工作.从输入信号中经过怎样的变换来提取特征通常需要很多的领域知识.而在深度学习中,学习到的网络的隐含节点对应于从输入信号中经过变换后的特征,并且这些特征是逐层越来越抽象的.图3是以人脸识别为例,深层网络隐含节点所学习到的特征的示意图.在网络的输入层是每一个图像块,每个像素对应于一个神经元.在第一个隐含层学习到的是一些非常简单的模式,即一些带有方向性的各种边缘,这些模式与计算机视觉多年研究得到的视觉底层特征很类似.在更高层的隐含节点对应于更高一层,更抽象的特征.到最高层,对应于图像的高级语义特征.而网络结构逐层学习到更为抽象的特征,和神经科学中对视神经研究得到的结果也很吻合.因此,深度网络学习的不仅仅是分类器,而且包含了需要的特征.

让深度学习成为热点的另一个重要原因是其在实际应用方面的贡献.语音识别是一个经过多年研究的课题.在使用深度学习方法之前的若干年中,其识别性能没有大的提高.而在使用了深度学习方法后,其性能有了一个飞跃(见表1).表1中GMM-HMM是使用深度网络之前的最好的算法,DNN-HMM是使用深度网络的算法.可以看到在这两个测试中,错误率有了大幅度降低.这大大推进了语音识别的产业化进程.到目前为止,一些最好的语音识别系统都采用了深度学习技术,这包括微软、谷歌、百度等公司的语音识别系统.

下面再以图像目标识别为例看深度学习的贡献.在使用ImageNet图像数据库进行的图像中的物体识别竞赛中,在2010和2011年最好的系统识别率分别为72%和74%.Hinton带领的研究小组使用了深度学习技术,2012年获得了竞赛的冠军,其识别率为85%.由此可以看到深度学习的贡献.

目前,对深度学习还存在不同的意见.主要存在下面的批评,一个是深度学习没有理论.机器学习领域研究人员非常关心深度学习的理论进展.人们很想知道深度神经网络为什么可以具有这样好的性能?其理论依据是什么?如果从统计学习的角度看,其泛化能力如何?这是深度学习目前需要研究和解决的问题.

对深度学习的另一个批评是深度学习中需要太多的经验和人工尝试和技巧.和传统的神经网络的研究类似,深度学习中需要确定网络的层数,每层的节点数,节点的激发函数等因素.因此,不容易掌

1619

张长水:机器学习面临的挑战

Object models

Object parts

(combination

of edges)

Edges

Pixels

图3具深层网络隐含节点特征学习示意图(以人脸识别为例,修改自文献[12]) Figure3Features learned by hidden nodes in deep network for face recognition,modi?ed from[12]

表1两种语音识别系统在两个数据集上的错误率比较

Table1Contrast of two speech recognition system on two di?erent datasets

Task Size of training data(h)DNN-HMM GMM-HMM Switchboard(test set1)30918.527.4

Switchboard(test set2)30916.123.6

握和使用.

此外,大规模数据的学习对于深度学习也是一个不小的挑战.目前要解决的图像识别和语音识别的学习数据往往几十万、几百万以上的样本量,利用通常的计算机运行深度学习方法学习一遍数据通常需要几天,或者是几十天的时间.这完全不能满足人们的需要.因此,一些研究人员做了一些深度学习加速算法的工作.

3.3概率图模型

概率图模型是对随机变量之间的条件独立性建模的工具.概率图模型一直受到关注,只是Kollar 的书的出版,让概率图模型变得更受重视.

概率图模型的一个贡献是让很多的模型有了更为简洁的表示,因此,我们对于很多模型有了更为直观和深刻的认识.这包括了很多常见模型:主成分分析、高斯混合模型、隐马尔科夫模型、独立成分分析等.特别是在解决实际问题时,从概率图模型的角度建模,模型表示简单易理解,其推理也变得容易理解.因而,在计算机视觉、语音识别、文本分析的文章中常常见到用概率图模型建模.深层神经网络也同样可以用概率图模型表示和分析.

1620

中国科学:信息科学第43卷第12期

1000 o b j e c t c l a s s e s t h a t w e r e c o g n i z e

图4

ImageNet 图像数据库部分图像1)Figure 4Partial images in ImageNet dataset 1)

因为对条件独立性建模,当所研究的问题中很多变量之间满足条件独立性时,采用概率图模型建模有助于缓解维数灾难带来的困难.对此,上文中已经讨论过.

和基于向量空间数据的建模相比,概率图模型较好的结合了领域知识,即随机变量(特征)之间的条件独立性.机器学习通常把研究对象看作一个黑盒子,这是因为在很多情况下不清楚研究对象的输入输出关系.当对于这个输入输出关系有所认识时,充分利用这些知识有利于对于问题的解决.而概率图模型是充分利用了随机变量之间的条件独立关系这一知识.

概率图模型的一个主要问题在于推理的困难.在精确推理时,其算法计算复杂度是指数爆炸的.因此,一些近似推理方法被研究和提出.深度神经网络可以用概率图模型来表示.深度神经网络采用了逐层学习和推理的方式,很显然,这是一种近似,但却取得了非常好的学习性能.因此,是否可以由此获得一些启示而采用类似的近似方法对概率图模型学习和推理?

4结语

本文主要讨论的是目前机器学习面临的挑战和当前大家关心的几个问题.其主要目的是希望能够

1)修改自https://www.wendangku.net/doc/cf10309959.html,/challenges/LSVRC/2010/index 1621

张长水:机器学习面临的挑战

对当前的机器学习研究进行一些梳理,对今后的研究有更多的思考.

参考文献

1Kollar D,Friedman N.Probabilistic graphical models:principles and techniques.Cambridge:The MIT Press,2009 2Balasubramanian M,Schwartz E L.The isomap algorithm and topological stability.Science,2002,295:7

3Roweis S T,Saul L K.Nonlinear dimensionality reduction by locally linear embedding.Science,2000,290:2323–2326 4Mayer-Schnberger V,Cukier K.Big Data.Sheng Y Y,Zhou T,translated.Hangzhou:Zhejiang People’s Publishing House,2013[Mayer-Schnberger V,Cukier K.大数据时代.盛杨燕,周涛,译.杭州:浙江人民出版社,2013]

5Wang F,Zhao B,Zhang C.Linear time maximum margin clustering.IEEE Trans Neural Netw,2010,21:319–332

6Deng J,Dong W,Socher R,et al.ImageNet:a large-scale hierarchical image database.In:Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Piscataway:IEEE,2009.248–255

7Krizhevsky A,Sutskever I,Hinton G.Imagenet classi?cation with deep convolutional neural networks.In:Proceedings of NIPS Conference,Lake Tahoe,2012.1106–1114

8Sheng V S,Provost F,Ipeirotis P G.Get another label?improving data quality and data mining using multiple,noisy labelers.In:Proceedings of14th ACM International Conference on Knowledge Discovery and Data Mining.New York:ACM,2008.614–622

9Chen S,Zhang J,Chen G,et al.What if the irresponsible teachers are dominating?a method of training on samples and clustering on teachers.In:Proceedings of24th AAAI Conference,Atlanta,2010.419–424

10Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks.Science,2006,313: 504–507

11Yan P F,Zhang C S.Arti?cial Neural Networks and Evolutionary Computing.Beijing:Tsinghua University Press, 2000[阎平凡,张长水.人工神经网络与模拟进化计算.北京:清华大学出版社,2000]

12Lee H,Grosse R,Ranganath R,et al.Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations.In:Proceedings of26th Annual International Conference on Machine Learning.New York:ACM,2009.609–616

Challenges in machine learning

ZHANG ChangShui

Department of Automation,Tsinghua University,State Key Laboratory of Intelligent Technologies and Systems, Tsinghua National Laboratory for Information Science and Technology(TNList),Beijing100084,China

E-mail:zcs@https://www.wendangku.net/doc/cf10309959.html,

Abstract In this paper,we describe and analyze the challenge of machine learning research,high dimensional data and the curse of dimensionality,the scalability of the machine learning algorithms,the di?culty of opti-mization,and the bad explicability.And we discuss a few hot topics:deep learning,big data,and probabilistic graphical models,etc.

Keywords machine learning,deep learning,probabilistic graphical model,big data,optimization

1622

中国科学:信息科学第43卷第12期ZHANG ChangShui received his B.S.

degree in mathematics from Peking

University,Beijing,China,in1986,and

M.S.and Ph.D.degrees in control sci-

ence and engineering from Tsinghua

University,Beijing,in1989and1992,

respectively.He joined the Department

of Automation,Tsinghua University,in

1992,and is currently a Professor.He

has authored more than200papers.

His current research interests include

pattern recognition and machine learning.He is currently an

Associate Editor of the Pattern Recognition Journal.He is a

member of the Standing Council of the Chinese Association of

Arti?cial Intelligence.

1623

2016年深圳市中小学电脑机器人活动方案

2016年深圳市中小学电脑机器人活动方案 根据《广东省教育厅关于举办第十七届广东省中小学电脑制作活动的通知》(粤教信息函〔2016〕5号)精神,为进一步推进我市中小学信息技术教育,普及智能机器人教育,提高学生的信息素养和科技创新意识,制定本方案。 一、组织机构 活动由市教育局主办,成立活动组织委员会,下设活动组委会办公室,全市各中小学自愿参加活动。 (一)主办单位: 深圳市教育局。 (二)承办单位:深圳市教育信息技术中心。 (三)协办单位:深圳市育新学校。 (四)支持单位:各区教育局、各新区公共事业局,市局直属各学校。 (五)“2016年深圳市中小学电脑机器人活动”组委会组成人员: 主任:吴筠(深圳市教育局副局长) 执行主任:杨焕亮(深圳市教育信息技术中心主任) 执行副主任:殷刚(深圳市育新学校校长) 委员:黄泽武(深圳市教育信息技术中心) 汪涛(深圳市育新学校) 王奕奕(深圳市教育信息技术中心)

麦志彪(深圳中学) 各区电教站(教育信息中心)、各新区教科研中 心和市局直属学校电脑机器人活动有关负责人 二、活动目的 进一步推进我市中小学信息科技教育,为青少年提供一个机器人活动交流与学习的平台,推动机器人科学技术的普及;激发创新精神,培养实践能力,鼓励更多的青少年机器人爱好者在电子、信息、自动控制等高新科技领域进行学习、探索和实践。 三、参与对象 全日制普通高中、初中、小学在校学生。 四、比赛项目及组别 (一)实体机器人竞赛项目 1.小学组:机器人创意设计比赛、现场制作挑战赛、机器人灭火、一对一机器人足球、“撬动地球”竞赛、“九宫建设”竞赛、“资源再生”竞赛、超级轨迹赛、创意闯关竞赛、狂飙投篮赛、能源争夺战、智能垃圾分类收集机器人比赛、“校园足球”训练营测试赛。 2.初中组:机器人创意设计比赛、现场制作挑战赛、机器人灭火、二对二机器人足球、二对二机器人篮球、人型机器人全能挑战赛、“撬动地球”竞赛、“火星救援任务”竞赛、“九宫建设”竞赛、“资源再生”竞赛、超级轨迹赛、创意闯关竞赛、狂飙投篮赛、能源争夺战、智能垃圾分类收集机器人比赛、创意机器人趣味运动

NOC活动竞赛类项目湖北省选拔赛活动方案

NOC活动竞赛类项目湖北省选拔赛活动方案一、项目设置、竞赛规则及有关要求 (一)项目设置 竞赛按学段分小学组、初中组、高中组等三组进行:

(二)竞赛规则 竞赛规则以组委会在中心(馆)网站(http://***************、 http://**********、http://*********)上公布的“2016年湖北省中小学电脑制作活动暨第十七届全国中小学电脑制作活动竞赛类项目湖北省选拔赛竞赛规则”为准(拟于四月中旬在网上发布) (三)有关要求 各地负责本地区参赛队伍的组织和报名工作,并委派专人担任领队,负责率队参赛。各地要在广泛动员的基础上选拔优秀队员和代表队参加竞赛,并于2016年5月20日前将“竞赛类项目”参赛名单(附表1)和“竞赛类项目”(组队)报名表”(附表2)寄到组委会办公室,同时以电子邮件形式提交。逾期不予补报。 报名限额: 1、机器人灭火竞赛:每队限报1人; 2、机器人足球竞赛:一对一足球项目每队限报1人,其它每队限报2人; 3、机器人篮球竞赛:每队限报2人; 4、人型机器人全能挑战赛竞赛:每队限报1人; 5、能力风暴WER能力挑战赛—“撬动地球”:每队限报2人; 6、纳英特智能挑战赛—“九宫建设”:每队限报2人; 7、BotBall—“火星救援任务”竞赛:每队限报2人; 8、西觅亚FLL工程挑战赛—“资源再生”:每队限报2人。 9、中鸣超级轨迹赛:每队限报1人。 10、人形机器人舞台剧展演:每队限报2人; 11、机器人创新设计与技能挑战:每队限报2人;

12、机器人场地越野:每队限报2人; 13、机器人超市购物:每队限报2人; 14、物流机器人:每队限报2人; 15、城市机器人挑战赛—“灌篮高手”:每队限报2人; 16、VEX机器人挑战赛—IQ系列:每队限报2-4人; 17、每个选手限报一个项目; 竞赛场地及相关器材由竞赛组委会提供。参赛选手个人使用的器材(机器人、计算机及程序软件)由参赛选手自备,只要符合“机器人”概念的各类机器人产品均可参加竞赛活动。鼓励选手积极创新,不提倡直接使用厂家成品参加竞赛。每台机器人只能参加一个项目的比赛。 二、奖项设置 1、个人奖。按竞赛项目及学段组设置个人一等奖、二等奖、三等奖各若干。各获奖选手的指导老师可获得与选手同等次的奖项。 2、组织奖。设置“最佳组织奖”若干。评奖以各市(州)组织工作和竞赛成绩等为主要依据确定。 各地要严把报名关,杜绝弄虚作假行为;请领队做好组织协调工作,维护竞赛正常秩序。对于弄虚作假、干扰竞赛等不良行为,将取消其评奖资格。 三、竞赛方式 根据各地报名情况确定竞赛方式。具体事项另行通知。 四、赛前培训 为了提高对机器人竞赛活动的指导水平,组委会拟在四月中旬举办有关培训班。请各市(州)选派指导教师和领队(1人)参训,熟悉掌握比赛规则,以便做好竞赛组织和选手训练工作。培训通知另行发文。

机器学习的发展现状及其相关研究

机器学习的发展现状及其相关研究 摘要: 阐述了机器学习的概念及其研究现状, 讨论了其中的关键技术、难点及应用与发展前景, 并对机器学习研究中的有关问题提出一些看法. 关键词: 人工智能; 机器学习; 泛化 1 机器学习的发展现状 机器学习(machine learning)是继专家系统之后人工智能应用的又一重要研究领域, 也是人工智能和神经计算的核心研究课题之一. 机器学习是人工智能领域中较为年轻的分支, 其发展过程可分为4 个时期: 1)20 世纪50 年代中期到60 年代中期, 属于热烈时期; 2)60 年代中期至70 年代中期,被称为机器学习的冷静时期; 3)70 年代中期至80 年代中期, 称为复兴时4)1986 年开始是机器学习的最新阶段. 这个时期的机器学习具有如下特点: 机器学习已成为新的边缘学科并在高校成为一门独立课程; 融合了各种学习方法且形式多样的集成学习系统研究正在兴起; 机器学习与人工智能各种基础问题的统一性观点正在形成; 各种学习方法的应用范围不断扩大, 一部分应用研究成果已转化为商品; 与机器学习有关的学术活动空前活跃. 2 机器学习的概念、类型及特点 2.1 机器学习的基本概念

机器学习的研究主旨是使用计算机模拟人类的学习活动, 它是研究计算机识别现有知识、获取新知识、不断改善性能和实现自身完善的方法.机器学习的研究目标有3 个: 1)人类学习过程的认知模型; 2)通用学习算法; 3)构造面向任务的专用学习系统的方法.在图1 所示的学习系统基本模型中, 包含了4 个基本组成环节. 环境和知识库是以某种知识表示形式表达的信息的集合, 分别代表外界信息来源和系统所具有的知识; 环境向系统的学习环节提供某些信息, 而学习环节则利用这些信息对系统的知识库进行改进, 以提高系统执行环节完成任务的效能. “执行环节”根据知识库中的知识完成某种任务, 同时将获得的信息反馈给学习环节. 2.2 基于符号的机器学习 基于符号的机器学习, 是基于代表问题域中实体和关系的符号集合. 符号学习算法就是利用这些符号推出新颖、有效的一般规则, 规则同时也用这些符号进行表述. 1)变型空间搜索. 候选解排除算法依赖于变量空间这个概念, 是与训练实例一致的所有概念描述的集合. 这些算法有更多实

机器学习面临的挑战_张长水

中国科学院学部科学与技术前沿论坛 信号与信息处理专刊 中国科学:信息科学2013年第43卷第12期:1612–1623 https://www.wendangku.net/doc/cf10309959.html, https://www.wendangku.net/doc/cf10309959.html, 机器学习面临的挑战 张长水 清华大学自动化系,智能科学与技术国家重点实验室,清华信息科学与技术国家实验室(筹),北京100084 E-mail:zcs@https://www.wendangku.net/doc/cf10309959.html, 收稿日期:2013–06–20;接受日期:2013–11–13 国家重点基础研究发展计划(批准号:2013CB329503)和国家自然科学基金(批准号:91120301,61075004)资助项目摘要该文讨论了机器学习目前面临的几个挑战,包括:高维特征空间和数据量问题,大数据量的计算困难,寻求最优解的困难和可解释性差等问题.然后针对当前很多人关心的几个重要问题,例如大数据问题,深度学习,概率图模型等做了分析,以引起深入思考. 关键词机器学习深度学习概率图模型大数据优化问题 1引言 过去的二十多年的时间里,机器学习的研究得到了快速发展,取得了一系列令人瞩目的研究成果,同时也面临很多的挑战.我们需要对机器学习的现状和面临的挑战进行探讨和梳理,以引起更深入的思考. 2机器学习面临的挑战 虽然机器学习取得了令人瞩目的成果,但是仍然面临很多困难和问题.下面列举其中的一些问题. 2.1高维特征空间与样本数的不足 在很多实际应用问题中,得到的特征维数是比较高的,有的甚至是非常高的.例如,在图像识别中如果提取SIFT 特征,特征维数是128维,如果提取其他特征,维数也往往是几十维,或者几百维.还有,在文本分类问题中,如果把每一个单词当作一个特征,特征的维数可能是几千维,或者上万维,这依赖于所使用的字典大小. 下面以概率密度函数的估计为例讨论特征维数和所需要的样本之间的关系.对于一维的概率密度函数估计来说,通常在具有几十个以上的样本时可以得到一个比较好的函数估计,这是因为在每一个点附近应该有一定量的样本(也就是说,数据要具有一定的密度)才能得到好的估计结果.我们假设至少需要10个样本,这是一个保守的数字.如果要估计的是一个二维概率密度函数,就需要把二维空间等分成一些小网格,需要每一个小网格中有足够多的样本.因此,可能需要102=100个样本.当维数增加的时候,空间中小的格子的数量随维数的增加而指数上升.假设维数为d ,需要的样本数是10d .

组织行为学课程考试习题含答案

习题与参考答案 第一篇概述 第一章组织与组织行为 1、什么是组织 答:组织是对完成特定使命的人的系统性安排。1、是由人组成的集合;2、组织是适应于目标的需要;3、组织通过专业分工和协调来实现目标。 2、组织行为研究的三个层面各包括哪些内容 答:第一:把组织看成是个人的集合:有关人性、需要、动机和激励等方面的理论是用来说明单个组织成员的行为和绩效的。对诸如价值观、知觉、态度、个性、意志和情感这些因素也予以考虑,并对他们在工作中的个体行为与绩效的影响进行研究。 第二:把重点放在组织成员的小组、群体上,研究其相互作用和相互影响:人们在一起工作的常规方式是小组、部门、委员会这些组织形式。因此,在组织行为学中,一个可选择的富有成效的方法是分析工作群体的功能,如规范、凝聚力、士气、沟通、人际、合作与竞争等。第三:把组织看成是一个整体来研究:力求理解组织结构和组织设计如何影响组织效率和气氛,如何影响有效沟通和信息传递,认识组织与环境之间的关系及其影响,认识组织变革和发展的规律,从而尽可能提高组织的有效性,改进组织气氛。 第二章组织行为学的发展 1、组织行为学发展过程中产生了哪些主要学说受到哪些学科发展的影响 答:组织行为学是随着管理的发展而产生和发展的。(一)古典理论时期(1900—1930年),受管理科学发展的影响;(二)人力资源理论,受心理学研究的影响;(三)权变理论进入管理领域——组织行为学的形成,受哲学思想发展与社会学发展的影响;(四)组织文化研究的兴起——组织行为学的深入,行为科学发展的影响。 2、21世纪组织行为学面临的挑战有哪些 答:一、经济全球化对组织行为学研究的影响;二、高新科技,特别是信息技术的发展,对组织行为学研究的影响。(网络化、扁平化、灵活性、多元化、全球化) 第三章组织行为学的研究方法 1、行为研究中的原则 答:1949年,行为科学命名大会上的四项决定: 1、理论的肯定和证明必须靠公众都能够观察了解的客观事实,不能单凭学者个人的经验; 2、尽量使用数理化的方式来说明假设,以便精密地测试和修正; 3、尽量使各种论述精确,以便能用严密的试验予以肯定或否定; 4、使用自然科学所惯用的“厘米—克—秒”制作为度量工具。 2、实验法中的变量有哪些 答:自变量、因变量、控制变量。 3、个案研究中的例与弊。 答:运用个案调查、综合分析、案例研究等手段,对人们的心理与行为作出全面分析与评估。

机器学习及其算法发展分析

机器学习及其算法发展分析 发表时间:2019-07-18T10:00:54.027Z 来源:《科技尚品》2019年第1期作者:赵明刘复星 [导读] 随着当今社会的发展和科技的进步,机器智能化在各个领域的应用越来越广泛。由于当下机器学习还处于初始阶段,主要依赖监督学习,且并未完全攻克弱人工智能,相关人员需要不断完善机器学习理论基础和实践。在对应科学范畴和计算机技术发展中,应为机器学习提供良好的环境,机器学习的发展前景十分广阔。要积极吸取发达国家的经验和教训,在人工智能技术上不断创新发展。 中国汽车技术研究中心有限公司 引言 在现代化信息技术的支持下,计算机技术为智能人工技术发展奠定良好基矗以计算机技术为支持的智能计算技术涉及了统计学、逼近论、算法复杂论以及凸分论等学科知识,可通过计算机技术,利用自身的学习经验,在自我系统中不断完善自身性能。以计算机规律性信息数据为支持,在计算机中找到规律性信息,获取知识经验,实现计算机技术的智能化,使得计算机向人工智能方向发展。 1概述 机器学习是AI人工智能的一个分支,在人工智能的时代机器学习作为一门重要的分支越来越受到学术界以及社会的关注,机器学习是一门涉及多领域的交叉学科,涉及统计学、凸分析、概率论、算法复杂度等多学科多门类,通过研究计算机相关模拟性能以及人类学习习惯和行为来获得新的技能或者新知识,并且根据自身框架结构不断优化完善自身体系性能。在此基础上持续优化模型,使得后续工作执行得更好。机器学习是令计算机不呈现程序即可显示获得某些功能的学习领域,也是计算机自身获取知识并逐步反馈逐步改进提示的过程。机器学习的研究需要以神经网络,统计分类等统计学,生物学为基础,让机器模拟人类学习过程。对此需要输入巨量的数据和学习样本以形成人类所知的"经验",不断重复拆分、回归、聚合,最终得到元素间的关系并可依此形成类似经历的判断和预测。因此也应用于数据挖掘,大数据处理等基于海量数据的预测,应用领域十分广泛,涉及大数据分析、数据深度挖掘、自然语言处理、搜索引擎、语音识别、机器人控制应用等。 机器学习的本质在于数据的整合归纳,模型的建立和算法的改进。在整个学习过程中,最基本的条件是持续的外界反馈,以某种方式形成的外界信息源,运用算法将获取的外部信息加工成为"经验",并储备在内在的数据库里。数据库根据建立的原则和规律提供执行的行动,而行动过程中获得的外界信息又成为了新的反馈来源,对下一次的行为提供新的指导信息。 2机器学习分类内容 机器学习中数据处理以人为标注为标准判断机器学习,主要有监督和无监督两种形式。监督学习是将学习目标采取具有标签的数据辅助完成学习,这种学习方式在实践中效果显著。但是,采取监督学习方式成本较大,价格昂贵。采用先进无监督学习则通过计算机自身自动化技术学习,以多种数据完善先验式知识吸收,整体上成本可控,不需要大量资金投入;但是,这种学习方式的实际效率较低。 2.1监督学习 监督学习以人为方式标注目标,初始训练数据是监督学习中需收集的必然数据。监督学习能够将机器自身泛化能力充分发挥出来,可以有效解决分类和回归问题。这种监督学习经典算法为卷积神经网络、多层感知机和逻辑回归等。经典方式由BN、SVN、KNN以及CBR等组成。由标注特征对机器展开数据集训练,使其能够学习对不同事物的合理划分,以学习的方式对规则、规律数据进行预测。 2.2无监督学习 无监督学习中,机器在未标记样本数据时,不进行的训练,开展无监督学习。无监督学习可以在机器学习中及时区分一些原理相似性概念,无监督学习可以和人类一样学习需要的知识。这种无监督的学习经典性算法分为深度置信网络、受限玻尔兹曼机、自动编码器等内容,在解决聚类问题上有广泛的应用。 3机器学习的经典算法 机器学习目标是在一定的网络结构基础上,构建符合要求的数学模型,选择合理的学习方式和数据训练方法,学习输入数据的内在模式和数据结构,不断调整内部参数,通过数学工具求解模型最优化的预测反馈,提高泛化能力、防止过拟合进行半独立甚至独立的繁琐性工作。机器学习算法主要是指通过数学及统计方法求解最优化问题的步骤和过程,下面以机器学习领域经典的BP算法、卷积神经网络和深度学习算法来介绍。 3.1BP算法 BP算法属于有监督学习,该算法的基本原理如为浅层前向型神经网络计算模型,包含输入层、隐藏层和输出层,由大量神经元作为网络节点彼此连接,每个神经元通过激励函数处理作为网络权值的连接强度信号,通过调整这些连接强度,将输入数据中包含的模式信息映射到输出层。 3.2卷积神经网络 本质上,卷积神经网络是一种带有卷积结构的多层前馈神经网络,但区别于传统的全连接前馈神经网络,CNN具有局部连接和参数共享的重要特征,从而减少了连接和权值的数量,降低了网络模型的复杂度,提高了计算效率,特别是网络规模越大、效果越显著。另外,CNN通过层叠的卷积和下采样操作自动提取具有平移不变性的局部特征。 3.3深度学习算法 深度学习是机器学习的一个最新分支。Hinton等人于2006年提出基本概念,是机器学习基于数据辩表征学习的方法,用半监督式或非监督式的特征学习和分层特征提取高效算法来替代手工获取特征。人们一直在研究数字神经网络与人类大脑间的关系,随着对生物神经科学和计算机技术深入研究及它们的发展与应用,人们逐渐认识到神经网络的分层计算模型与人类大脑结构的特定区域相对应。近年来,深度学习模型的研究与应用成果也进一步证明了这个事实。因此,深度学习网络模型是最接近人类大脑的智能学习方法和认知过程,这也是其实践应用的理论依据。 4机器学习未来与发展 4.1非监督学习 非监督学习,目前还未是一门成熟的学科,主要关注统计数据密度问题,在训练中所需的已标识数据是经人工处理而成,且需由相关

2012江苏省青少年机器人大赛规则4.05

2012年江苏省青少年机器人 竞赛规则 2012.5.9 -2012.5.11

2012江苏省青少年机器人竞赛规则 江苏省青少年机器人规则 (1) 通用附则 (3) 机器人灭火竞赛规则 (4) 一代足球机器人竞赛规则 (12) 二代足球机器人竞赛规则 (17) 机器人篮球竞赛规则 (23) 人型机器人全能挑战赛竞赛规则 (28) 机器人综合技能比赛主题与规则 (33) FLL机器人挑战赛主题与规责 (42) VEX机器人工程挑战赛主题与规则 (54) 机器人创意比赛主题与规则 (70) 绿色城市主题竞赛规则 (74)

江苏省青少年机器人竞赛总则 一、参赛人 凡现在就读于江苏省的中小学生,对机器人有兴趣均可参加基层举办的选拔赛。 二、本届机器人竞赛与省中小学电脑制作活动机器人竞赛合并进行选拔。 时间:2012年5月9日---11日 三、承办单位及地点:苏州工业园区青少年活动中心 四、参赛要求 1、各市参赛队的名单须在2011年4月20日前报省竞赛组委会办公室,机器人创意比赛详见P102页,逾期为自动放弃。 2、市级机器人竞赛应参照全省比赛的竞赛规则进行,竞赛组委会将根据各市组织的比赛规模,按照一定的比例分配参赛名额。各市根据限定的名额数,择优向竞赛组委会进行申报。每名参赛选手只能申报参加一个竞赛项目。参赛单位未经批准不能重复参加相同的竞赛项目。 3、江苏省机器人教育示范基地已达标的学校需参加比赛的项目(二队不能超过三个比赛项目)必须经省竞赛组委会批准方可直接参加省比赛。 4、为了支持申请承办省青少年机器人竞赛的单位,承办单位可赛后优先选择一项参加全国机器人竞赛的项目。 5、各市参加比赛的代表队成员,参赛期间的费用一律自理。 6、比赛规则和申报表在江苏省青少年科技教育网https://www.wendangku.net/doc/cf10309959.html,,江苏省青少年科技创新活动服务平台https://www.wendangku.net/doc/cf10309959.html,下载。 五、省青少年机器人竞赛仲裁工作委员会 省青少年机器人竞赛仲裁工作委员会、专家由竞赛组委会聘请相关科学家、机器人技术专家和优秀教育工作者组成。 六、省青少年机器人竞赛裁判工作委员会及裁判员 江苏省机器人裁判工作委员会由竞赛组委会聘请机器人技术专家、优秀教育工作者和省级裁判员组成。 本届裁判员将从参加过省级机器人竞赛裁判员培训合格的裁判员中选拔,并邀请参加竞赛的裁判工作。 七、机器人竞赛基本规则和注意事项 1、本届竞赛分小学组、初中组和高中组。 2、参加竞赛的小学组、初中组和高中组均需自带电脑和比赛所用器材。凡参加竞赛的参赛队员和教练员或领队都必须在竞赛前填写参赛机器人使用指定厂家器材的承诺书后方可参加竞赛。 3、省青少年机器人竞赛指定器材厂家为: 创智、西觅亚、上海未来伙伴、中鸣 4、竞赛期间,由指定厂家的技术人员及有关专家组成竞赛机器人鉴定小组,指定厂家有义务派专业人员做好这项工作,否则将不能作为竞赛指定厂家。 5、凡参赛机器人上必需贴有该参赛队学校的标志,标志的位置和大小不得超过该项比赛规定,以裁判能看清楚为好。 6、竞赛规则中提供小学组、初中组和高中组的各项目竞赛场地样稿,比赛时以竞赛组委会所提供的比赛环境为准。 7.机器人学校团体奖基本标准须三项比赛成绩相加11分(一等5分、二等3分、三等1分)以上,方可参加评选。

机器学习经典书目汇总

机器学习经典书目汇总 本文总结了机器学习的经典书籍,包括数学基础和算法理论的书籍。 入门书单 《数学之美》 作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。 《Programming Collective Intelligence》(《集体智慧编程》) 作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Solutions》(《数据之美:解密优雅数据解决方案背后的故事》)的作者。这本书最大的优势就是里面没有理论推导和复杂的数学公式,是很不错的入门书。目前中文版已经脱销,对于有志于这个领域的人来说,英文的pdf是个不错的选择,因为后面有很多经典书的翻译都较差,只能看英文版,不如从这个入手。还有,这本书适合于快速看完,因为据评论,看完一些经典的带有数学推导的书后会发现这本书什么都没讲,只是举了很多例子而已。 《Algorithms of the Intelligent Web》(《智能web算法》) 作者Haralambos Marmanis、Dmitry Babenko。这本书中的公式比《集体智慧编程》要略多一点,里面的例子多是互联网上的应用,看名字就知道。不足的地方在于里面的配套代码是BeanShell而不是python或其他。总起来说,这本书还是适合初学者,与上一本一样需要快速读完,如果读完上一本的话,这一本可以不必细看代码,了解算法主要思想就行了。 《统计学习方法》 作者李航,是国内机器学习领域的几个大家之一,曾在MSRA 任高级研究员,现在华为诺亚方舟实验室。书中写了十个算法,每个算法的介绍都很干脆,直接上公式,是彻头彻尾的“干货书”。每章末尾的参考文献也方便了想深入理解算法的童鞋直接查到经典论文;本书可以与上面两本书互为辅助阅读。

组织行为学面临的挑战

浅析组织行为学面临的挑战 姓名:丁素 班级:营销111 学号:016111118

浅析组织行为学面临的挑战 摘要:20世纪八九十年代以来,组织行为学面临空前的挑战。外部环境系统出现了变化性的增加、稳定性减弱和复杂性增加,确定性减弱的趋势,要求组织确定新的效益观和生态观,组织行为学的研究也必将在管理理论和管理实践的历史变革中不断地创新和发展。 关键词:挑战;新组织;人性;激励; 一、问题的提出 根据美国学者安德鲁.J.杜布林(A.J.Dubrin)的定义:组织行为学是系统研究组织环境中所有成员的行为的一门学科,以成员个人、群体、整个组织以及外部环境的相互作用形成的行为作为研究的对象。因而组织行为学的应用重点是组织中管理者与被管理者之间、管理者之间、被管理者之间的行为关系,如何运用理论来指导实践,提高公司的管理绩效和员工满意度,激发个体的工作潜能,实现管理科学化。然而世界经济环境的不断变化给组织行为学的发展带来了很多机遇的同时,也带来了一些挑战。 二、“新组织”的兴起带来的挑战 随着知识经济的不断发展,一些新的组织如团队型组织、虚拟组织、学习型组织、扁平化组织,多元化组织,无边界组织,网络组织等也不断发展壮大起来。相对于比较固定的传统组织结构,在新型组织结构中,网络化大大优化了信息流程,使得组织结构也越来越灵活多变,这样很有利于加快上下左右信息传递的速度,以利于组织中个体之间的沟通,还推动了组织从构筑明确性的组织边界转变为无边界管理或渗透边界管理。这些新型组织结构形式通过企业的组织重构简化内部组织结构,尤其是正式组织结构,弱化等级制度,促进组织内部信息的交流、知识的分享和每位成员参与决策过程,使得企业组织对外部环境的变化更敏感、更具灵活性和竞争实力。同时,由于技术进步的速度加快,竞争激烈,必然带来劳动市场流动率的提高、临时性增加和员工忠诚的减弱等,这样就必须要通过组

组织行为学

单选题:15X1 名词解释:5X5简答题:4X8论述题;1X13案例分析题;1X15(一题里面有多个小题) 1.组织的定义(1名词解释) 组织是一群人的集合,为了完成共同的目标与使命,组织成员按照一定的方式相互合作结成的有机整体,从而形成单独的个人力量简单相加所不能比拟的整体力量。(张德) 2.组织行为学(2名词解释) 组织行为学是研究组织中人的心理和行为表现及其规律,提高管理人员预测、引导和控制人的行为的能力,以实现组织既定目标的科学。 3经济人(9名词解释):为了经济利益而活动,所有的经济现象都是由具有利己主义的人们的活动所产生的。 4知觉:是人脑对直接作用于感觉器官的客观事物各种属性、各个部分及其相互关系的整体反映。 5性格:一个人对现实的态度和习惯性的行为方式中所表现出来的较为稳定的心理特征。 6价值观:是指一个人对周围客观事物(人、事、物)的是非、善恶和重要性的总评价和看法。7群体:为了实现某个特定目的,两个或两个以上相互作用、相互依赖的个体的组合。(P160) 8沟通:是借助一定手段把可理解的信息、思想和情感在两个或两个以上的个人或群体中传递或交换的过程。 9群体地位:地位指的是他人对于群体或群体成员的位置或层次进行的一种社会界定。在群体中。地位代表了群体对某一个体所估计的价值,具体包括弥散性身份特征和特定身份特征 10冲突:个人或群体内部、个人与个人之间、个人与群体之间、群体与群体之间互不相容的目标、认识或感情,并引起对立或不一致的相互作用的任何一个状态。 3.正式与非正式组织的区别 正式:权力、目标、责任非正式:情感、兴趣、爱好 例如:跳广场舞是组织,是非正式 4.行为是什么? 行为是一个人应付环境的所有活动,是对外部刺激的反应(行为心理学家华生) B=f(P,E) B(Behavior):个人行为的向量 P(Personality):个人的内在心理因素——内部力场 E(Environment):外界环境因素——外部力场 5.组织行为?(层次) 定义:组织行为是指人们作为组织成员时表现出来的,体现在个体、群体、组织三个层面上的行为。 6.组织行为学的产生与发展(选择题) (1)源起 代表人物:1亚当.斯密(劳动分工理论、“经济人”观点) 2 查尔斯.巴比奇(建议制度、奖励、工资加利润分享制度、协作) 3 罗伯特.欧文(“现代人事管理之父”) 4 弗雷德里克.泰勒(提高劳动生产率、四项职能、科学管理原理、被称为“科学管理之父”) (2)古典组织管理理论 代表人物:1亨利.法约尔(“现代经营管理之父”、14项原则——统一指挥和权力等级链) 2 马克斯.韦伯(提出“理想的行政组织体系”,被称为“组织理论之父”) 3 巴纳德(社会系统学派,被称为“现代组织理论之父”) (3)行为科学理论

机器学习研究与应用新进展

第10章机器学习研究与应用新进展 徐从富李石坚王金龙 (浙江大学人工智能研究所,杭州 310027) 2005年10月7日第一稿 2006年10月16日第二稿 10.1 机器学习研究与应用综述 10.1.1 机器学习的发展概况 机器学习(Machine Learning)不仅是人工智能的一个核心研究领域,而且已成为整个计算机领域中最活跃、应用潜力最明显的领域之一,它扮演着日益重要的角色。近年来,欧美各国都投入了大量人财物进行机器学习的研究和应用,Intel、IBM、波音、微软、通用电器等大型公司也积极开展该领域的研究和开发,而且已有不少研究成果进入产品。美国航空航天局JPL实验室的科学家们在2001年9月出版的《Science》上撰文指出:“机器学习对科学研究的整个过程正起到越来越大的支持作用,……,该领域在今后的若干年内将取得稳定而快速的发展。”此外,机器学习研究的热门程度还可以从该领域的国际权威期刊《机器学习研究学报》(Journal of Machine Learning Research,简称JMLR)的影响因子(Impact factor)看出,据美国科学引文检索公司(ISI)统计,2004年该学报的影响因子已达到5.952,这是除了《ACM计算综述》(ACM Computing Survey)以外影响因子最高的计算机类期刊。需要特别说明的是,《ACM计算综述》每年只发表12篇世界级权威计算机专家关于某个研究方向最新研究进展的综述文章,一般并不发表研究论文,2004年其影响因子为10.037。 1997年Tom M. Mitchell在“Machine Learning”一书中给出了机器学习的经典定义——“计算机利用经验改善系统自身性能的行为。”还有人认为,机器学习是“神经科学(含认知科学)+数学+计算”的有机结合,数学则填补了神经科学与计算之间的鸿沟。与很多新兴学科一样,机器学习也是一个多学科交叉的产物,它吸取了人工智能、概率统计、神经生物学、认知科学、信息论、控制论、计算复杂性理论、哲学等学科的成果。实践证明,机器学习在很多应用领域发挥了重要的实用价值,特别是在数据挖掘、语音识别、图像识别、机器人、车辆自动驾驶、生物信息学、信息安全、遥感信息处理、计算金融学、工业过程控制等

组织行为学

组织行为学在线考试复习资料 一、单选题(每题4分共5道小题总分值20分) 1.在组织行为学中,把由组织正式文件明文规定的群体称为( C )。A封闭群体 B开放群体 C正式群体 D非正式群体 1.赫兹伯格认为,激励员工的关键在于( C )。 A提供给员工更高的工作报酬 B加强对员工的监督和控制 C设计出一种能让员工感到工作本身就是激励的工作任务 D创造良好的工作条件 4.我国改革的实践和某些单位改革的实践证明,广大群众和高层领导对改革态度比较积极,但中间的领导层对改革的阻力较大,这指的是( D )。 A五十九岁现象 B哑铃现象 C马奇士效应 D中梗阻现象 5.人类行为是自动自发的,外力可能影响其行为,但无法发动其行为,这是指人类行为的( A )。 A自发性 B固定性 C目的性 D持久性

2.一个人的事业究竟向哪个方向发展,为使其明确,可以通过( A )。A制订事业生涯的计划 B了解个人的实力和专业技术 C鼓励自我控制的前途和命运 D人尽其才,避免人力资源的浪费3.关于冲突观念的现代观点认为( D )。 A冲突有害无益 B冲突应当避免 C冲突有利无害 D冲突在适度水平是有益的 4.工程心理学又称人类工程学,它主要研究调整( A )。 A人—机关系问题 B人—人关系问题 C人际关系问题 D人—组织关系问题 5.事业生涯管理的宗旨是( D )。 A提高组织单位的向心力和凝聚力 B帮助个人设计有前途的职业生涯 C使个人的职业生涯为组织目标服务 D职工个人和组织的计划与目标的协调统一 2.在新的环境和挑战的冲击下,决定员工的福利和薪酬方式的是(A )。 A员工 B公司 C顾客 D供应商 3.按照观察者与被观察者的关系划分,可将组织行为学的观察法分为( )。C

机器学习讲义

1 一月二月三月 产品名称数 量 金 额 利润产品名称 数 量 金 额 利 润 产品名称 数 量 金额利润 合计合 计合计 四月五月六月 产品名称数 量 金 额 利 润 产品名称 数 量 金 额 利 润 产品名 称 数 量 金 额 利 润

机器学习讲义 (2010年春硕士课程试用) 第一章绪论 序 机器学习通常被认为是人工智能领域的一个分支,但和人工智能一样,实际上是多学科的融合。为了说明什么是机器学习,我们来看一下“自动”(automation) 和“自主”(autonomy) 这两个概念的区别。在通常的“自动化”系统中,所有的“智能”都是系统设计者预先注入的。当系统放入它的运行环境中去之后,将按照预定的程序进行活动。但是如果设计者对环境的了解是不全面的,系统就有可能陷入无所适从的境地(系统中的知识是由人工编程输入的,知识中的错误也不能自动改正。)。这时“学习”的能力就成为唯一可依靠的解决方法,也是实现机器超过人这个终极智能的唯一手段。具有学习能力的系统称为是“自主的”。学习意味着根据经验改进自身。学习的真谛在于:感知不仅用于当前的行动,而

且用于改进以后的行动。学习是系统和环境交互的结果,也来自于系统对自己决策过程的观察。学习的范围极广,从仅仅记住经验,到创造整个的科学理论,所有这些活动都是学习的过程。 简而言之,机器学习意味着通过编程使计算机进行学习。比如,让计算机从医疗记录中学到治疗新疾病的最佳方案;使智能房屋根据经验学到基于主人生活习惯的能源消耗优化方案;开发个人软件助手为用户从在线晨报中摘出该用户特别感兴趣的内容;等等。机器学习研究的进展对社会经济的影响将是巨大的,它能使计算机的应用领域大为扩展,并使个人和组织的竟争力提高到新的水平,甚至形成人类全新的生活方式。另外,对机器学习的信息处理算法的研究将导致对人脑学习能力(及其缺陷)的更好的理解。 就机器学习研究的现状而言,我们必须承认,目前还不能使计算机具有类似人那样的学习能力。但是,对某些类型的学习任务已经发明了有效的算法,对学习的理论研究也已经开始,人们已经开发出许多计算机程序,它们显示了有效的学习能力,有商业价值的应用系统也已经开始出现。 在理论方面,关于观察例的数目,所考虑的假设的数目和学习到的假设的预计误差之间的基本关系的刻画已经取得成果。我们已经获得人类和动物学习的初步模型,开始了解它们与计算机学习算法之间的关系。 在应用方面,近十年来的进展尤为迅速。下面是一些突出的应用实例:语音识别:所有最成功的语音识别系统都以某种形式使用了机器学习技术。例如,SPHINX系统学习针对具体讲话人的策略从接受到的语音信号中识别单音和单词。神经网络学习方法和学习隐藏的Markov模型的方法可有效地应用于对个别讲话人,词汇表,麦克风的特性,背景噪音等的自动适应。类似的技术也可用于许多其他的信号解释问题。 自动车驾驶:机器学习方法已用于训练计算机控制的车辆在各种类型的道路上的正确行驶。例如,ALVINN系统使用学习到的策略在高速公路上与别的车辆一起以每小时70英里的速度自动行驶了90英里。类似的技术也可用于许多其他的基于传感器的控制问题。

《组织行为学》模拟试题

《组织行为学》模拟试题一 一、单项选择题(每小题2分,共30分) 1、著作《科学管理原理》的作者是(D) A、亚当·斯密 B、查尔斯·巴比奇 C、罗伯特·欧文 D、弗雷德里克·泰勒 2、心理学家霍兰德认为,影响个人职业选择的重要决定因素是(B) A、能力类型 B、人格类型 C、气质类型 D、外貌类型 3、把性格划分为外倾型和内倾型,是依据下列哪类划分标准(C) A、按何种心理机能占优势 B、按思想行为的独立性 C、按心理活动的某种倾向性 D、按人的行为模式 4、情境领导理论认为,当下属(或群体)的工作成熟度发展到高水平时,领导者应采取的领导方式是(D) A、命令型领导B、推销型领导C、参与型领导D、授权型领导 5、属于领导权变理论的是(B) A、领导作风理论B、途径-目标理论C、管理方格论D、交易型与变革型领导理论 6、气质类型中粘液质的主要行为特征是(C) A、敏捷活泼 B、小心迟疑 C、缓慢稳定D、迅猛急躁 7、常言道:“一俊遮百丑”,这是指人知觉偏差中的(B) A、投射B、晕轮效应C、首因效应D、刻板印象 8、下列哪种行为体现了员工以主动和建设性的方式表达不满(B) A、离职 B、进谏 C、忽略D、忠诚 9、强化可以分为正强化、负强化、惩罚和(C) A、奖励B、倒退C、消退D、激励 10、目标理论认为对目标的合适程度可以从三个角度加以分析,即目标的具体性、目标的难易度和(A) A、目标的可接受性 B、目标的实践性C、目标的合理性D、目标的科学性 11、领导行为连续统一体模式理论是(B)提出的。 A、勒温B、坦南鲍姆和施米特C、利克特D、豪斯和沙特尔 12、在团队发展的(C)阶段,团队内的人际关系由敌对走向合作,合作态度明显;程序和行为规范得以建立和实施;沟通频繁,工作效率提高。 A、初创期 B、初见成效期C、持续发展期D、成熟期 13、下面哪一项是领导者(而不是管理者)的特征(B) A、信赖控制B、创新C、正确地做事D、关注效率和方法 14、下列属于正式沟通网络的是(D)

组织行为学思考讨论题

第一章组织行为学概述 1. 古典组织理论对组织行为学有什么贡献? 古典管理理论的主要内容包括享利?法约尔提出的“一般管理”理论和马克斯?韦伯提出的“理想的行政组织体系”。其贡献在于:突出了管理中采用科学方法的重要性;指出坚持学习会不断地改善工作方法;确定了在组织有效运作中的许多重要原则;强调了薪金作为激励因素的潜在重要性。 古典组织理论为后来的行为科学和现代管理学派奠定了管理学理论的基础,当代许多管理技术与管理方法皆来源于古典组织理论。古典的管理学派所研究的问题有一些仍然是当今管理上所需要研究的问题,当今的许多技术与管理方法也都是对古典的管理思想的继承和发展。 2. 人际关系理论对组织行为学有什么贡献? 梅奥的人际关系理论的重要贡献主要有两个方面:一是发现了霍桑效应,即一切由“受注意了”引起的效应;二是创立了人际关系学说。 人际关系理论第一次把管理研究的重点从物的因素上转到人的因素上来,提出了人才是企业发展的动力之源、有效沟通是管理中的艺术方法、建立企业文化是寻求效率逻辑与感情逻辑之间动态平衡的有效途径等,这不仅在理论上对古典组织理论做了修正和补充,开辟了管理研究的新理论,还为现代行为科学的发展奠定了基础,因而对管理实践产生了深远的影响。 3.简述组织行为学的研究对象和研究内容。 组织行为学的研究对象是人的心理和行为规律性,也就是说,组织行为学既研究人的心理活动的规律性,又研究人的行为活动的规律性。 组织行为学的研究对象规定了组织行为学的研究内容包括个体行为、群体行为和组织行为。组织行为学研究的个体行为,主要包括两大部分:一是关于影响个体行为的主观因素,二是关于个体行为的外部控制。群体行为主要包括群体动力、群体规范、群体压力、群体凝

人型机器人任务挑战赛规则重点

人型机器人全能挑战赛竞赛规则 一、任务 要求机器人在规定的时间内完成多项挑战动作。每个动作都有相应的分数,从起始区出发按逆时针方向依次完成挑战动作,完成动作越多、用时越少,得分越高。 在比赛中,参赛队员除了要掌握机器人编程和对物理、力学平衡等知识的应用外,还要考虑如何面对一个多任务的项目,在有限时间内取得最好的成绩。 二、竞赛场地说明 竞赛场地的外尺寸是235cm×113cm,上面有机器人跨栏、机器人钻障碍、机器人侧向行走、机器人上下楼梯和机器人滑雪的场地设施。 在场地中粗黑线是机器人做每项动作的起始线,粗红线是机器人做每项动作的终止线。机器人在做每项动作前双脚不能越过本动作任务的起始线和上个动作任务的终止线,在做每项动作时机器人必须从本动作任务的起始线进入,机器人的双脚完全越过本动作任务的终止线才可以视为机器人完成该动作。 竞赛场地环境为冷光源、低照度、无磁场干扰。但由于一般赛场环境的不确定因素较多,例如,场地表面可能有纹路和不平整,光照条件有变化等。参赛队在设计机器人时应考虑各种应对措施。 三、任务说明和得分 1.机器人跨栏

(1)规则:跨栏尺寸如图所示。要求机器人通过指定高度的栅栏。机器人可以接触栏,但不得碰翻或移动栏(栏的任一部分的垂直投影不得超出起始线、终止线或在边界外),否则视为动作失败而不能得分。 (2)记分:机器人成功跨过栏,可获得该项动作的100分,不成功则得0分。 2.机器人钻障碍 (1)规则:障碍物尺寸如图所示。要求机器人从一个具有固定高度的障碍物底下钻过。在障碍物的上面有一个平衡杆,杆的材质为塑胶,直径是1cm。机器人可以接触障碍物,但不得碰翻或移动障碍物(即障碍物的任一部分的垂直投影不得超出起始线、终止线或边界外),否则视为动作失败而不能得分。机器人若钻过障碍物,但碰落了上面的平衡杆,将 按照规则罚分。 (2)记分:机器人成功钻过障碍物,可获得该项动作的100分,不成功则得0分。

组织行为学:OB的挑战与机遇

组织行为学:OB的挑战与机遇 Challenges and opportunities for OB Understanding organizational behavior has never been more important for managers. A quick look at a few of the dramatic changes now taking place in organizations support this claim; In short, there are a lot of challenges and opportunities today managers to use OB concepts. 1.Improving quality and productivity (1)Total quality management (2)Reengineering 2.Improving people skills People skills are very important to managerial effectiveness. OB can help both managers and potential managers develop those people skills. 3.Managing work force diversity Work force diversity 劳动力多样性means that organizations are becoming more heterogeneous (= miscellaneous) in terms of gender, race, and ethnicity (the increasing heterogeneity of organizations with the inclusion of different groups). Employees do not set aside their cultural values and lifestyle preferences when they come to work. The challenges for organizations is to make themselves more accommodating to diverse groups of people by addressing their different lifestyles, family needs, and work styles. Work force diversity has important implications for management practice. Managers will need to shift their philosophy from treating everyone alike以同样的方式对待每个人to recognizing differences and responding differences in ways that will ensure employee retention 员工保持力and greater productivity—while, at the same time, not

相关文档