本次分享论坛聚集AAAI 2019的论文作者、学生及来自学术界和工业界的研究人员,提供平台让他们交流各自的工作及研究思路,讨论未来的研究方向。论坛通过分享的形式,促进知识的传播及交流并创造更多的价值和学习机会,帮助更多的粤港澳大湾区的青年学者宣传他们的科研成果。分享论坛分为CV Related Works、NLP and IR、Other applications 三个主题。
以下是一些汇报内容的精华总结(按出场顺序):
开场报告
Prof. Qiang Yang:GDPR,Data Shortage and AI
随着欧洲推出GDPR对数据隐私强监管,数据隐私保护问题受到空前关注。当前业界生态中数据的隔离和缺失的问题依然严重,不同公司各自掌握的数据集因隐私安全问题无法直接交换和集中成为真正的大数据。香港人工智能与机器人学会(HKSAIR)理事长杨强教授提出Federated AI Technology Enabler (FATE), 该方法结合Transfer learning和Federated learning为解决这一问题提供了良方。
主题一:CV Related Works
Jia Xu (Tecent AI Lab), Liu Pengpeng (CUHK): DDFlow: Learning Optical Flow with Unlabelled Data Distillation.
该工作于无标记的图片识别中Optical flow 的学习,利用data distillation无监督的学习方式达到高的准确率
Yang Sibei (HKU): Non-Local Context Encoder: Robust Biomedical ImageSegmentation against Adversarial Attacks
针对现在对于生物医学图像的一些恶意对抗攻击(Adversarial attacks),提出一种非局部上下文编码器,能够在这些被恶意攻击过的数据面前提高其他算法的鲁棒性
Cheng Chen (CUHK): Synergistic Image and Feature Adaptation: TowardsCross--‐Modality Domain Adaptation for Medical Image Segmentation
训练集与测试集服从同一分布的这一传统机器学习假设往往在实际中很难成立。作者利用Synergistic learning 的方法在医疗影像的feature和instance上实现了无监督领域适应,减小了训练和测试不同分布的影响
Yang Baoyao (HKBU): Cross-domain Visual Representations via Unsupervised Graph Alignment
同样针对训练集与测试集服从不同分布的问题,作者提出graph alignment的方法实现无监督领域实现,有效降低了训练和测试不同分布的影响
主题二:NLP and IR
Li Xin (CUHK): A Unified Model for Opinion Target Extraction and Target Sentiment Classification
提出一个以两个LSTM为基础的统一模型尝试同时解决在情感分析里的两个重要问题:意见对象提取和相应对象的情感分类
Li Zheng (HKUST): Exploit Coarse-to-Fine Task Transfer for Aspect-level Sentiment Classification
该工作主要解决了情感分析中aspect level情感分类的问题。为了解决aspect level数据较少的问题,该工作实现了从粗粒度情感分类到细粒度aspect-level情感分类的迁移,从而能够完成更好完成细粒度的aspect-level情感分类
Deng Yang (Peking University Shenzhen Graduate School): Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question Answering
提出利用多任务学习的方法去解决在自然语言处理中问答机制的短板,利用multi-view attention mechanism去同时处理几个不同方面的问题,例如text classification,sequence labeling
Farhad Bin Siddique (HKUST), Pascale Fung (HKUST): Global Trait: Personality Alignment of Multilingual Word Embeddings
提出一个新的语言处理的方向,以性格为导向,集中以自然语言数据进行性格分类,从而能够得出不同的personality analysis
Qian Yu (CUHK): Data Augmentation based on Adversarial Auto-encoder Handling Imbalance for Learning to Rank
该工作主要解决了信息检索中数据不平衡的问题,如:相关文档和无关文档的数目不平衡,不同query之间的不平衡。该工作主要利用AAE来做数据集增广的模型调整数据集,从而可以缓解不平衡问题
主题三:Other application
Tang, Ke (Southern University of Science and Technology): AutomaticConstruction of Parallel Portfolios via Explicit Instance Grouping.
该工作主要关注对NPC问题的解法器自动调参,从而提高求解速度和质量。该工作通过在特定问题上随机对参数进行尝试,从而将不同问题进行聚类并自动探索出合适的参数进行求解
Bingqian Du (HKU): Learning Resource Allocation and Pricing for Cloud Profit Maximization
工作使用Deep Deterministic Policy Gradient (DDPG)对云服务的资源进行分配和定价,从而最大化云服务商的收益
Liang Lan (HKBU): Accurate and Interpretable Factorization Machines
在传统FM的基础上,该工作提出了Subspace Encoding Factorization Machines (SEFM)。该工作引入了高度的稀疏性表达,从而学习出了更好的非线性关系,并能提供类似于打分系统的可解释性
Yin Kejing (HKBU): Learning Phenotypes and Dynamic Patient Representations via RNN Regularized Collective Non--‐negative Tensor Factorization
提出一个能够处理当前电子健康记录(EHR)高dimension的问题的数据处理方法,一个基于RNN和HITF模型建立的CNTF去学习记录的显型,从而能够更好的处理这种特殊的数据集
Ma Yuexin (HKU): TrafficPredict: Trajectory Prediction for Heterogeneous Traffic-‐Agents
为了能在复杂的城市交通环境实现自动驾驶,该工作提出了对自动驾驶车辆附近的其他车和人的轨迹进行预测,从而帮助自动驾驶系统进行决策。该工作收集了各种情况下各种车和人的运动轨迹作为数据集,并用lstm对运动轨迹进行建模获得良好的效果
集中于目前在自动驾驶的模型学习中,对于实际道路情况的数据集的缺失,使得得出的模型无法应对实际道路情况的问题。而本文的作者则收集建立了一个北京实际道路情况的数据集,并提出以轨迹追踪替代框架追踪,将所有物件能在同一框架下处理的方法
论文分享精彩瞬间
在专题探讨环节,主讲嘉宾和观众们主要探讨了视频识别的细节处理,如动作捕捉的时候某一些形状的缺失。还有在近期出现在图片识别中的对抗攻击与反攻击,观众对于这个概念非常感兴趣,并对其应用性及研究方向展开了深入的讨论。
「粤港澳大湾区AAAI 2019分享论坛」成功举行,充分展现了粤港澳地区在人工智能领域学术研究的成果和地位,并代表着新一代青年学者的工作和研究潜力。本次分享论坛也为连接在这同一领域不同方向的学者,连接不同大学及研究所的学者,连接学术界与工业界的人士提供了一个重要的平台,为人工智能的学术研究社区营造更好的环境。
更多HKSAIR及行业资讯,敬请关注香港人工智能与机器人学会公众号