北京邮电大学学报

在线办公

在线期刊

本期目录

2019年第42卷第6期刊出日期：2019-12-28 上一期下一期

综述

机器阅读理解的研究进展
王小捷, 白子薇, 李可, 袁彩霞
北京邮电大学学报. 2019, 42(6): 1-9. DOI:10.13190/j.jbupt.2019-111
摘要 ( 1161 ) PDF ( 1722 ) HTML 　　
为便于厘清机器阅读理解任务的研究现状，按照答案来源，将机器阅读理解分为完形填空、片段选择、多项选择和答案生成4类.在统一的编码器-交互与推理-输出框架下对此4类任务的已有研究进行了综述，并描述了2种对此框架的可能扩展；最后讨论了机器阅读理解未来需要解决的问题.
参考文献 | 相关文章 | 计量指标

智能对话系统架构及算法
黄毅, 冯俊兰, 胡珉, 吴晓婷, 杜晓宇
北京邮电大学学报. 2019, 42(6): 10-19. DOI:10.13190/j.jbupt.2019-169
摘要 ( 1448 ) PDF ( 1778 ) HTML 　　
智能人机对话系统综合应用了人工智能领域多项核心技术，随着深度学习、强化学习等基础算法的快速发展，人机对话系统的总体架构、算法体系以及应用模式都有了重大的改变和提升.从人机对话系统的架构、人机对话系统的核心算法和该领域面临的挑战以及技术研究方面做了综述.
参考文献 | 相关文章 | 计量指标

论文

基于Faster R-CNN模型X-射线图像的焊接缺陷检测
郭文明, 刘凯, 渠慧帆
北京邮电大学学报. 2019, 42(6): 20-28. DOI:10.13190/j.jbupt.2019-097
摘要 ( 1927 ) PDF ( 1554 ) HTML 　　
为了实现X-射线图片的焊接缺陷检测，采用了基于目标检测领域的经典模型——Faster R-CNN的目标检测方法.WDXI数据集是从大量的X-射线图像整理和分类构建获得的，包括7种缺陷类型和无缺陷类型.为了有效地提取焊接区域，提出了一种根据平均灰度值和单位面积内平均对比度值的改进方法.经过实验验证，可采取自适应的直方图均衡化以及两次中值滤波的方法分别进行图像增强和降噪处理.最终，在焊接缺陷识别的多分类任务中，训练模型在测试集上达到了预期效果，不仅证明了WDXI数据集的研究价值，还为实现焊接缺陷的自动识别和定位进行了实验性的尝试.
参考文献 | 相关文章 | 计量指标

大数据环境下基于深度学习的行人再识别
李鹏, 王德勇, 师文喜, 姜志国
北京邮电大学学报. 2019, 42(6): 29-34. DOI:10.13190/j.jbupt.2019-124
摘要 ( 648 ) PDF ( 811 ) HTML 　　
针对卷积神经网络在行人识别过程中错误率较高的问题，提出了一种基于深度胶囊模型的行人再识别方法.首先利用标准卷积层学习区分度较高的特征；然后将不同卷积层中的若干特征划分为一组，生成一个具有丰富语义特征的主胶囊.在此基础上，引入了动态路由算法，通过迭代路由过程来确定主胶囊和数字胶囊之间的归属关系，进而得到一组数字胶囊，其中，每个数字胶囊可以学习识别目标行人的存在.在具有挑战性的数据集上进行实验的结果表明，所提算法在性能上优于已有算法.
参考文献 | 相关文章 | 计量指标

基于深度学习的融合多源异构数据的推荐模型
冀振燕, 宋晓军, 皮怀雨, 杨春
北京邮电大学学报. 2019, 42(6): 35-42. DOI:10.13190/j.jbupt.2019-164
摘要 ( 1133 ) PDF ( 2546 ) HTML 　　
为了充分利用多源异构数据所提供的信息提高推荐准确度，提出一个基于深度学习的混合推荐模型.该模型融合评分、评论和社交网络数据进行推荐，采用深度学习方法对文本和评分进行特征学习，然后使用社交网络对采样进行约束，从而得到更准确的用户和物品的特征表示.实验结果表明，该方法具有较高的准确度.
参考文献 | 相关文章 | 计量指标

一种基于多智能体强化学习的流量分配算法
程超, 滕俊杰, 赵艳领, 宋梅
北京邮电大学学报. 2019, 42(6): 43-48,57. DOI:10.13190/j.jbupt.2019-140
摘要 ( 1118 ) PDF ( 1744 ) HTML 　　
传统的流量工程策略的研究大多集中在构建和求解数学模型方面，其计算复杂度过高，为此，提出了一种经验驱动的基于多智能体强化学习的流量分配算法.该算法无需求解复杂数学模型即可在预计算的路径上进行有效的流量分配，从而高效且充分地利用网络资源.算法在软件定义网络控制器上进行集中训练，且在训练完成后再接入交换机或者路由器上分布式执行，同时也避免和控制器的频繁交互.实验结果表明，相对于最短路径和等价多路径算法，新算法有效减少了网络的端到端时延，并且增大了网络吞吐量.
参考文献 | 相关文章 | 计量指标

基于深度学习的OBD端口占用状态自动识别算法
苏东, 余宁梅
北京邮电大学学报. 2019, 42(6): 49-57. DOI:10.13190/j.jbupt.2019-180
摘要 ( 629 ) PDF ( 1389 ) HTML 　　
针对光分路器（OBD）端口占用状态不能自动采集的问题，提出了一种改进型YOLOv3算法.增加第4个上采样特征图，提升高分辨率下密集小物体检测敏感度；针对端口固定高宽比特征，利用k-means聚类算法重新确定目标候选框个数和高宽比；提出软非极大值抑制算法，缓解端口靠近且被遮挡情况下引起的漏检、误检；针对4种疑难生产场景下的端口占用状态完成检测.实验结果表明，改进后的YOLOv3准确率达90.12%，相比原YOLOv3提升了5.17%.改进后的算法对于端口类物体具有更高的检测准确率.
参考文献 | 相关文章 | 计量指标

天牛须搜索的锚节点布设优化算法
邓中亮, 刘延旭, 胡恩文
北京邮电大学学报. 2019, 42(6): 58-63. DOI:10.13190/j.jbupt.2019-135
摘要 ( 743 ) PDF ( 962 ) HTML 　　
锚节点的布设方案决定了无线传感器网络的定位极限.针对现有布设算法存在计算开销大和优化策略具有局限性等问题，提出了基于天牛须搜索的锚节点布设优化算法.采用向量化的克拉美罗下界作为布设优化策略，通过功效系数法优化布设策略，并采用天牛须搜索算法实现布设的快速、精确收敛.仿真结果表明：与传统区域定位误差均界评价指标相比，所提算法使得99.74%的区域内定位性能极限提升了约38.79%；在25锚节点布设场景下，与遗传算法相比，布设后区域内定位性能极限大致相同，但搜索时间降低了约64.2%.
参考文献 | 相关文章 | 计量指标

基于DRL的MEC任务卸载与资源调度算法
薛宁, 霍如, 曾诗钦, 汪硕, 黄韬
北京邮电大学学报. 2019, 42(6): 64-69,104. DOI:10.13190/j.jbupt.2019-155
摘要 ( 791 ) PDF ( 1910 ) HTML 　　
为提高多接入边缘计算（MEC）任务卸载效率，提出了一个任务卸载和异构资源调度的联合优化模型.考虑异构的通信资源和计算资源，联合最小化用户的设备能耗、任务执行时延和付费，并利用深度强化学习（DRL）算法对该模型求最优的任务卸载算法.仿真结果表明，该优化算法比银行家算法的设备能耗、时延和付费的综合指标提升了27.6%.
参考文献 | 相关文章 | 计量指标

一种基于ANTLR的面向Scratch3.0的特征提取和检测系统
刘派, 孙岩, 任玮
北京邮电大学学报. 2019, 42(6): 70-75. DOI:10.13190/j.jbupt.2019-125
摘要 ( 612 ) PDF ( 642 ) HTML 　　
Scratch是一种适合少年儿童使用的可视化编程语言，并在全球的编程教育领域中受到广泛地关注.由于目前各大教育编程平台都开始使用Scratch3.0版本，而已有的特征提取和检测系统并不支持新版本，为此，提出了一种基于链表数据结构和一种语言识别工具（ANTLR）的面向Scratch3.0的特征提取和检测系统.实验结果表明，该系统可以有效地从项目中提取编程特征，并为学生和教师提供反馈，其检测性能和检测稳定性比Scratch2.0均有所提升.
参考文献 | 相关文章 | 计量指标

用于文本分类的多探测任务语言模型微调
傅群超, 王枞
北京邮电大学学报. 2019, 42(6): 76-83. DOI:10.13190/j.jbupt.2019-149
摘要 ( 701 ) PDF ( 1241 ) HTML 　　
预训练语言模型被广泛运用在多项自然语言处理任务中，但是对于不同的任务没有精细的微调.针对文本分类任务，提出基于探测任务的语言模型微调方法，利用探测任务训练模型特定的语言学知识，可提高模型在文本分类任务上的性能.设计了6个探测任务，覆盖句子浅层、语法和语义三方面信息.最后在6个文本分类数据集上验证了本文的方法，使分类错误率得到改善.
参考文献 | 相关文章 | 计量指标

一种基于多模态特征融合的骨质疏松评估方法
罗涛, 李剑峰, 韩家辉, 王艺宁, 雷璐
北京邮电大学学报. 2019, 42(6): 84-90. DOI:10.13190/j.jbupt.2019-150
摘要 ( 885 ) PDF ( 1205 ) HTML 　　
针对现有骨质疏松评估中诊断依据单一、准确率低的问题，综合考虑骨骼图像数据和问卷数据，首先提出一种基于深度神经网络的多模态特征融合骨质疏松评估方法；然后，针对骨骼图像特征较浅、结构固定的特点，使用Unet进行图像分割预处理，去除冗余信息以提升分类准确性；最后，针对普通卷积操作在把握全局信息方面的不足，提出采用基于non-local模块的卷积神经网络来进一步丰富特征信息.交叉验证结果表明，提出的多模态特征融合方法与仅单独使用图像数据或问卷数据的机器学习方法相比具有明显的优势，分类准确率分别提升了3.2%和22.3%.
参考文献 | 相关文章 | 计量指标

一种数据驱动的三维流场流线特征化筛选方法
熊光正, 黄智濒, 戴志涛, 杨武兵
北京邮电大学学报. 2019, 42(6): 91-97. DOI:10.13190/j.jbupt.2019-152
摘要 ( 536 ) PDF ( 899 ) HTML 　　
传统的流线可视化方法因视线遮挡和数据密集难以刻画流场特征，难以应对大规模数据，为此，从数据驱动的思路出发，提出了一种筛选三维流线的算法，实现对大规模精细流场的特征刻画.该算法对广泛撒点取得的流线集进行特征化，通过计算流线上各点的特征，并以此为依据对流线进行分段；基于所有分段的几何特征构建一组特征向量，并利用词袋方法建立一组词向量；以词向量为基础计算流线间的几何特征相似度，以评估各个流线间的相似性，实现对流线的筛选.通过在特定流线的查询和整体流线流场的压缩这2个典型应用场景上的应用，检验了该方法对流线筛选的效果.
参考文献 | 相关文章 | 计量指标

一种多变量制造过程中的关键变量检测算法
余凯祥, 陈振豪, 张四海
北京邮电大学学报. 2019, 42(6): 98-104. DOI:10.13190/j.jbupt.2019-172
摘要 ( 650 ) PDF ( 895 ) HTML 　　
提出了一种基于机器学习的多变量制造过程中的关键变量检测算法.该算法利用机器学习分类器对多变量制造过程进行数学建模，以随机打乱过程变量后分类器的性能变化作为评价指标，检测导致产品质量相对异常的关键变量.设计并生成了多变量制造过程的仿真数据集，在仿真数据集和基于中国某工厂的2个实际生产案例数据集上对算法的检测性能进行了性能验证，2次验证结果均表明算法检测性能良好.
参考文献 | 相关文章 | 计量指标

SA-Siam++:基于双分支孪生网络的目标跟踪算法
田朗, 黄平牧, 吕铁军
北京邮电大学学报. 2019, 42(6): 105-110. DOI:10.13190/j.jbupt.2019-141
摘要 ( 847 ) PDF ( 1188 ) HTML 　　
为了解决SiamFC在目标快速移动、背景与前景相似、光照强烈等复杂场景下鲁棒性低的问题，提出了一种新的基于语义和外观双分支孪生网络的跟踪方法SA-Siam++，包括通过沙漏-通道注意力机制提取语义信息的语义分支和通过SiamFC提取外观信息的外观分支.此外，将AlexNet网络更换为经过改进的VGG-16网络能显著增加特征提取能力.在OTB-2013、OTB-2015、UAV123和VOT2018等目标跟踪标准数据集上进行了实验.实验结果表明，所提算法获得的测试结果相比现有主流算法有较大提高，平均帧率为49帧/s，满足实时性要求.
参考文献 | 相关文章 | 计量指标

研究报告

混合采样与遗传算法相结合的垃圾网页检测
刘寒
北京邮电大学学报. 2019, 42(6): 111-117. DOI:10.13190/j.jbupt.2019-147
摘要 ( 539 ) PDF ( 1297 ) HTML 　　
垃圾网页检测存在数据不平衡、特征空间维度较高的问题，为此，提出一种基于随机混合采样和遗传算法的集成分类算法.首先，使用随机混合采样技术，通过随机抽样，减少多数类样本数量，用少数类样本合成过采样技术方法生成少数类样本，获得多个平衡的训练数据子集；然后使用改进的遗传算法对训练数据集进行降维，得到多个具有最优特征的训练数据子集；使用极端梯度算法（XGBoost）作为分类器，训练多个平衡数据子集，用简单投票法对多个分类器进行集成，得到新的分类器；最后对测试集进行预测，得到最终预测结果.实验结果表明，提出算法的分类结果与XGBoost的结果相比，准确率提高了约19.25%，且减少了建立学习模型的时间，提高了分类性能，是一种较好的分类算法.
参考文献 | 相关文章 | 计量指标

基于上下文感知的智能手机隐式身份认证机制
王任重, 陶丹
北京邮电大学学报. 2019, 42(6): 118-125. DOI:10.13190/j.jbupt.2019-043
摘要 ( 780 ) PDF ( 1467 ) HTML 　　
针对现有智能手机隐式认证方法难以被实际应用的情况，提出了一种基于上下文感知的隐式身份认证机制.首先，由智能手机内置传感器（加速计、陀螺仪、磁力计）获取点击行为数据；然后从这些数据中提取上下文特征以识别上下文信息（用户的身体姿势状态），同时提取点击特征为每个上下文训练相应的认证子模型用于认证；最后利用所收集的7000+数据进行实验评估.结果表明，该方案对不同用户进行认证所得的平均错误接受率和错误拒绝率分别为1.29%和1.03%，与无上下文感知的认证方法相比，平均错误接受率和错误拒绝率分别降低了1.72%和2.59%.所提的机制可有效提高身份认证的准确性.
参考文献 | 相关文章 | 计量指标

通过检测语义分歧识别无答案问题
刘咏彬, 王小捷, 袁彩霞, 易炼
北京邮电大学学报. 2019, 42(6): 126-133,141. DOI:10.13190/j.jbupt.2019-202
摘要 ( 583 ) PDF ( 660 ) HTML 　　
机器阅读理解中存在无法仅从给定文档中获取问题答案的特殊情况，为此，基于语义冲突检测的机器阅读理解网络（SCDNet）提出应通过检测问题与文档内容之间的语义分歧来识别这种情况.经分析发现，文档无法为问题提供答案的根本原因主要分为两类：一是文档中不包含问题所需的语义信息；二是二者包含的语义成分之间存在分歧.据此推断，可以通过检测文档语义信息是否全面涵盖问题所需的信息来识别问题是否可由文档信息给出回答.此外，通过在损失函数中加入答案文本长度惩罚项，网络优化目标函数更接近评测指标，系统性能得到提升.网络模型使用联合训练模型建模无答案的问题识别与答案抽取2个子任务，并使用端到端的方式训练.实验结果证明，其对无答案问题类别预测的正确率超过了性能先进的基线模型SAN2.0，在SQuAD2.0数据集上取得了72.43的F1值和76.96的无答案问题识别正确率.
参考文献 | 相关文章 | 计量指标

基于标签关联性的多标签Scratch分类算法
彭聪, 孙岩, 戚鹏
北京邮电大学学报. 2019, 42(6): 134-141. DOI:10.13190/j.jbupt.2019-126
摘要 ( 594 ) PDF ( 948 ) HTML 　　
为了实现Scratch可视化编程领域的作品分类，提出了一种基于标签关联性的多标签分类算法（MLLR），构建了一个有效的多标签Scratch分类模型.首先提取作品的Block使用特征、计算思维技能特征和复杂度特征3类特征作为分类特征；然后针对RAKEL算法随机选择标签子集，忽略了标签间的关联性，提出了改进的MLLR算法，该方法根据多标签之间的关联性来划分标签子集，再训练相应的标签幂集子分类器.实验结果表明，MLLR算法在分类性能和时间性能上优于RAKEL等多标签分类算法，构建的分类模型对于Scratch作品具有较强的适用性，分类的准确率达到81.3%.
参考文献 | 相关文章 | 计量指标

面向会话型推荐系统的个性化分层循环模型
王雅青, 郭彩丽, 楚云霏, 周洪弘, 冯春燕
北京邮电大学学报. 2019, 42(6): 142-148. DOI:10.13190/j.jbupt.2019-143
摘要 ( 559 ) PDF ( 1101 ) HTML 　　
为了精准地捕捉用户行为模式，引入中期兴趣的概念，提出一个基于循环神经网络（RNN）的个性化分层循环模型，通过在同一框架下联合利用用户的会话、区块和全部行为序列来学习用户的综合兴趣.利用一个捕捉会话内序列模式的会话级RNN建模用户的短期兴趣；设计了一个捕捉区块内相邻会话关联关系的区块级RNN，进一步描述用户的中期兴趣；使用一个用户级RNN追踪长期兴趣的演化；引入带有不同交互机制的融合层，以有效融合不同层次的兴趣信息.在3个真实数据集上进行实验，结果表明，该方法与先进的推荐方法相比，Recall@10提升了18.35%.
参考文献 | 相关文章 | 计量指标

基于用户行为序列特征的位置预测模型
胡铮, 刘奕杉, 朱新宁, 于建港
北京邮电大学学报. 2019, 42(6): 149-154. DOI:10.13190/j.jbupt.2019-106
摘要 ( 667 ) PDF ( 1329 ) HTML 　　
针对现有位置预测研究中忽略用户行为序列特性、预测精度提升受限的问题，提出了基于用户行为序列特征的位置预测模型.首先以人工提取的方式构建用户行为的序列特征，融合到位置预测模型中，构造了基于行为序列特征的循环神经网络模型（BCP-RNN）；借助RNN模型循环结构的特点，自动学习行为序列特征，并引入位置预测模型，构造了3层对称循环神经网络模型（TS-RNN）.实验结果证明，引入行为序列特征的BCP-RNN和TS-RNN模型，其预测性能均高于现有的位置预测模型，验证了行为序列特征对挖掘用户移动模式的重要性.相较于人工提取行为序列特征的BCP-RNN模型，TS-RNN不仅节省了人工特征提取的成本，还弥补了人工分析的片面性造成的偏差，具有更高的预测性能.
参考文献 | 相关文章 | 计量指标

全卷积神经结构的段落式图像描述算法
李睿凡, 梁昊雨, 冯方向, 张光卫, 王小捷
北京邮电大学学报. 2019, 42(6): 155-161. DOI:10.13190/j.jbupt.2019-057
摘要 ( 603 ) PDF ( 1019 ) HTML 　　
针对段落式图像描述生成研究中提升描述语句之间的连贯性问题，提出了一种基于全卷积结构的图像段落描述算法.采用基于卷积网络的区域检测器获取图像表示，结合段落在语言学角度的层次性，构建一种层次性的深度卷积解码器对图像表示解码，自动生成段落式文本描述.同时将门控机制嵌入卷积解码器网络中，以提升模型的记忆能力.实验结果表明，相比于基于循环神经网络等传统段落图像的描述方法，新算法能够为图像生成更为连贯的段落式文本描述，在评测指标上取得较好的结果.
参考文献 | 相关文章 | 计量指标

PM_2.5浓度预测与影响因素分析
彭岩, 赵梓如, 吴婷娴, 王洁
北京邮电大学学报. 2019, 42(6): 162-169. DOI:10.13190/j.jbupt.2019-153
摘要 ( 1074 ) PDF ( 1446 ) HTML 　　
针对PM_2.5浓度的非线性和不确定性，提出了一种基于集成树-梯度提升决策树（EnsembleTrees-GBDT）的PM_2.5预测模型.该模型首先在集成树框架下进行特征选择，即选取PM_2.5浓度主要影响因素，使用算术均值聚合法计算出各项特征对PM_2.5浓度增加的影响程度，并以影响程度由强到弱的次序排序；其次使用网格搜索对GBDT算法进行参数优化，选取树的深度等参数的最优值；最后构建完整的PM_2.5浓度集成预测模型.使用北京市2015-2016年的污染物浓度和气象条件观测值2个数据集，对模型进行了预测仿真实验.对比实验结果表明，所提出的EnsembleTrees-GBDT预测模型相比于决策树、随机森林、支持向量机等模型，具有更低的平均绝对误差和均方根误差，同时具有更好的泛化能力，能够更准确地预测PM_2.5浓度，并实现对PM_2.5浓度影响因素的有效分析.
参考文献 | 相关文章 | 计量指标

基于素描对视频的人脸识别研究
陈平, 皇甫大鹏, 王兴建, 党徳鹏
北京邮电大学学报. 2019, 42(6): 170-176. DOI:10.13190/j.jbupt.2019-183
摘要 ( 574 ) PDF ( 692 ) HTML 　　
在公共安全领域查找关键人，需在视频中比对素描进行检索.为此，改进了仅依靠对素描和视频数据中的人脸提取整体或者局部特征的识别算法，将人脸识别问题转为人脸检索问题，把这2种媒体数据表示为第3种数据，即图像列表.通过比较图像列表完成最终的特征比对.所设计的系统扩展了人脸识别的研究范围，且支持多种媒体数据的检索.对比人脸视频分析融合系统，对素描-视频数据进行人脸识别，结果显示，所提出算法的正确识别率和曲线下面积都有相应提高，而等错误率降幅显著.
参考文献 | 相关文章 | 计量指标