近日,第五届人工智能与机器人国际会议(ISAIR2020)公布论文录用结果,其中由影谱科技和北京大学智能影像生产实验室研究发表的两篇学术论文《基于实例迁移学习的跨领域文本分类算法》和《基于步态行为振动的Gabor原子分解地形分类》双双被ISAIR2020录用。这是继论文《基于迁移学习的情感分析研究》入选国际期刊《IEEE Access》后,该实验室的研究成果再次获得国际学术界的认可。
据了解,ISAIR2020由国际人工智能和机器人学会、电气和电子工程师协会(IEEE)所辖大数据特别技术委员会、模式识别国际协会(IAPR)、国际光学和光子学学会共同组织举办。作为人工智能与机器人交叉领域的重要国际会议,汇聚了全球领先的一流前沿研究成果。影谱科技智能影像生产实验室作为国内首个专注于视频领域的智能影像生产实验室,一直致力于智能影像技术及虚拟现实等技术理论延伸与技术研究,此次学术成果获ISAIR2020收录,正是源于该实验室在相关领域的长期积累和不懈探索。
在机器学习和深度学习的热潮中,目前拥有广泛实际应用潜力的迁移学习成为较热门的研究方向。迁移学习技术因其领域间知识、技能和经验的迁移能力,已成为跨领域文本分类的重要手段和研究热点。由于跨领域文本分类在数据挖掘领域具有广阔应用前景,而通过迁移学习技术,可借助于已有知识的领域帮助目标领域数据实现语义信息的共享和迁移,简单而又高效地解决跨领域文本处理问题。
在本次入选ISAIR2020的论文《基于实例迁移学习的跨领域文本分类算法》中,影谱科技智能影像生产实验室的研究团队提出一种基于实例的跨领域分类算法MTrA。该算法以TrAdaBoost为基础,采用一种集成的学习方式,并将源域和目标域的特征分布差异考虑在内,采用最大均值差异值作为两域分布差异的权重参数,并在源域数据的权重更新方式中增添了考虑源域分类准确性的权重回补因子,平衡了源域样本的权重更新方式。MTrA采用标准数据集20 Newsgroups进行分组实验,分类准确性与TrAdaBoost算法相比大约提升了9.4%,证明了本算法的有效性和优势。
图:实验组rec vs talk在不同迭代中准确性的变化
图:实验组recvssci在不同迭代中准确度的变化
图:实验组sci vs talk在不同迭代中准确性的变化
此外,随着深度学习等技术的不断突破,越来越多的生物特征被提取出来并进行识别,如人脸识别、指纹识别、虹膜识别等。而在此基础上,步态识别,作为全球前沿的生物特征识别技术之一,也正逐渐走进人们的视野。
本次入选的论文《基于步态行为振动的Gabor原子分解地形分类》,就是以异常步态行为的检测与识别为研究方向,通过技术突破,使得异常步态识别的准确性和速度得以明显提升。影谱科技智能影像生产实验室的研究团队采用一种内置三轴加速度传感器的智能移动终端,实现了对人体步态的采集。同时,利用匹配将信号数据分解成Gabor原子的线性组合后采用时频联合分析方法,分析了三维空间中的运动特性。为了解决时频分析中复杂的计算问题,在研究中对异常步态数据进行了训练、分类和识别。
图:基于振动的地形分类算法流程图