AAAI 2020 參會心得

前言

今年二月初的時候，我前往紐約曼哈頓參加了AAAI 2020 會議，距離上次去美國已經是5年前的加州了，這也是我第一次去美東。

很幸運我投稿的論文被錄用了 (Discovering New Intents via Constrained Deep Adaptive Clustering with Cluster Refinement, accept rate=20.56%)。原本打算和實驗室同學一起從北京出發，無奈因為疫情的關係，臨時改從台灣出發前往紐約。由於同學都無法參與會議，我一個人就背了11張Poster…

介紹

簡單介紹一下AAAI。AAAI 全名為 Association for the Advancement of Artificial Intelligence，在整個CS領域會議的h-index排名第七（根據guide2research排名），是傳統AI研究的No.1會議。只要和AI沾得上邊的研究這裡都有，內容五花八門、千奇百怪。主要可以分成研究性(佔90%)、實戰性和前瞻性的論文。通常這種大型學術會議都會伴隨著許多姊妹會議一起舉行。例如這次AAAI就主要由四個會議組成：
AAAI = AAAI + EAAI + IAAI + AIES

AAAI 34th (Association for the Advancement of AI)
- AAAI-20 welcomes submissions reporting research that advances artificial intelligence, broadly conceived. The conference scope includes all subareas of AI and machine learning. 偏學術報告，領域包山包海
IAAI 32ed (Innovative Applications of AI)
- … focus on successful applications that showcase novel uses of AI technology. 偏實戰應用，包含解決方案、部屬經驗和未來挑戰
EAAI 10th (Educational Advances in AI)
- EAAI-20 provides a venue for researchers and educators to discuss issues and share resources related to teaching AI and using AI in education. 偏教育（K-12，從幼稚園到高中）
AIES 3rd (Conference on AI, Ethics, and Society)
- Ethical concerns and challenges … multi-disciplinary efforts can find the best ways to address these concerns … we expect papers will be submitted using different approaches. 偏倫理隱私，歐美學者特別關心

今年的共有8000+篇論文投稿，錄用1591篇論文，共4000+人參與會議，但有800+人因為疫情而無法開會（見詳細報導）。可以看到有37%的錄用論文來自中國，且最熱門的投稿領域分別為ML, CV和 NLP。

約1/3的論文會被選做oral presentation (20 mins)，其餘論文則做poster presentation (但有 2 mins 的 poster spotlight, short oral)。AAAI採用白天oral、晚上poster的方式來進行，所有oral論文也可以自由選擇是否在晚上也進行poster presentation。

Tutorial, Workshop (Day 1,2)

會議前兩天主要是tutorial和workshop。個人覺得兩者差異在於：

- tutorial會對特定主題進行由淺入深、成體系的完整教學，一日培訓班
- workshop像是小型的conference，涵蓋各種五花八門的小研究主題，如果哪天這個題目有足夠學者關注和學術能量，就可以獨立舉辦成conference如：EAAI和AIES。

Tutorial共有23個，大部分在官網都有釋出slides，這邊推薦幾個我覺得不錯的：

Explainable AI: Foundations, Industrial Applications, Practical Challenges, and Lessons Learned
- 可解釋性：由淺入深＆鉅細靡遺，非常適合入門（大推）
Exploration-Exploitation in Reinforcement Learning
- 需具備RL基礎：FAIR出品，內容豐富
Recent Advances in Machine Teaching – From Machine to Human
- 讓機器來教導人類
Guidelines for Human-AI Interaction
- AI 相關的HCI設計
Representation Learning for Causal Inference
- AAAI 很火的Causal Inference
Graph Neural Networks- Models and Applications
- 去年最火的GNN

Workshop有23個，像獨立小conference，只有部分給slides，推薦幾個對話領域的：

8th Dialog System Technology Challenge (DSTC), 對話領域最知名的競賽之一，通常會由企業和學校共同舉辦，每年都會放出許多高質量的任務＆數據集，今年共有四個track：
- End-to-end Task Completion Dialog Challenge (Microsoft)
- Audio Visual Scene-Aware Dialog Track (Mitsubishi)
- Predicting Responses, Identifying Success, and Managing Complexity in Task-Oriented Dialogue
- Scalable Schema-Guided Dialogue State Tracking (Google)
3rd Reasoning and Learning for Human-Machine Dialogues (DEEP-DIAL)
- 主要關注於如何在人機對話中加入推理，並使對話具備可解釋性、有道德
1st Workshop on Interactive and Conversational Recommendation Systems (WICRS2)
- 基於對話的個性化推薦系統，很新穎的研究方向
1st Deep Learning on Graphs: Methodologies and Applications (DLGMA)
- 在深度學習中透過圖對結構化數據建模，包括時序性、多關係、多模態數據。

IAAI 2020
和workshop, tutorial一樣在會議的前幾天舉辦，其中的實戰應用主題五花八門，包括

AI in Health
AI in Customer Support and Marketing
AI in Visual Inspection and Detection
AI in Trade and Finance
AI in Emergency Readiness and Response
AI for Recommendation Engines
AI in Utilities
AI in Text Analysis, Classification and Generation Use cases
AI for Trust and Trust of AI

講兩個我在AI in Customer Support and Marketing聽到的報告

Feedback-Based Self-Learning in Large-Scale Conversational AI Agents (Amazon Alexa)
- 目的：降低語音助手/音箱整體的意圖理解(NLU)錯誤率
- 方法：通過Markov Model自動分析人機對話系統中的失敗案例，並挖掘出正確回答進行rewrite
  - 錯誤可能源自語音識別和意圖理解模型不準確，也有可能是使用者發音不標準XD，這個方法背後有個很重要的假設(inductive bias)是：使用者在系統理解錯誤的時候，會重新糾正直到系統正確答覆為止。
- 結果：降低30%錯誤率 (p<0.001)
- 心得：很漂亮的解法，值得一試，不知道是否能應用於語音助手之外的對話系統？
Question Quality Improvement (QQI) Deep Question Understanding For Incident Management in Technical Support Domain (IBM Watson)
- 目的：降低線上Tech客服的TTR (Time-to-resolve)
- 方法：從文本中抽取結構化知識(IE任务)，提昇問題質量
  - 抽取的內容包括：Symptom、Activity、Intent
  - 構建系統的中間過程也用算法(Parsing)進行了簡化
- 結果：抽取Intent + Activity 最重要，最高可减少33.6% 的TTR
- 心得：通過ML模型進行QQI，取代重複腦力勞動 Nice（領域知識還是很重要）

EAAI 2020
講一個鬼故事，當我們還在談CS教育，歐美已經在實踐把AI教育融入CS教育中了

On Contemporaneous Computing Education: ML for K-12
- 目的：喚起學生對學習AI的興趣，做中學
- 方法：從頭建立足球動作分數預測模型
  - 在從模型迭代過程中，目標（什麼踢球姿勢是「好」的）＋使用者反饋很重要
  - 教練：提供目標、領域知識
  - 學生：提供使用者反饋
- 心得：台灣是否考慮跟進一波，感覺可以從棒球入手？

AIES 2020 (AI, Ethics, and Society)
絕對是未來的AI研究的主流之一，看看黑鏡影集就知道這塊領域有多重要了。

CERTIFAI: A common framework to provide explanations and analyse the fairness and robustness of black-box models
- 目的：提昇AI-based決策的可解釋性、公平性和魯棒性
- 方法：通過genetic算法生成counterfactuals，研究在boundary附近但卻有不同decision的樣本
  - 適用場景：我該改哪些條件，才能順利申請到貸款？
- 結果：通用於任何黑箱模型的分析方法
- 心得：感覺只適用於輸入為continuous data space的模型(文本就很難，embedding更難解釋)

AIES的提問環節非常熱烈，例如我們應該追求齊頭式平等還是立足點平等（真平等）、如果模型根據性別、年紀、種族等不可改因素決策怎麼辦？都很值得深思。講者最後說了一句話：Educate ethic is hard, but not impossible，還是有很多學者在這塊持續努力。

AI for Social Impact
AAAI進幾年來崛起的Special track，講一個有意思的talk

Contextualizing AI for Social Good
- 目的：分享在非洲用AI研究瘧疾，並與當地農夫合作的經驗
- 方法：眾包農夫們來蒐集監測的影像資料
- 結果：太容易讓人挫折了，與其說impact，喚起重視的作用更大
  - 社交很重要：關係、性別、年齡、習俗 > 科技
  - 部署很重要：哪來的設備、設備要放哪、相關配套措施？
- 心得：如何讓計畫長期執行下去是最難的，很多都是短期研究，當地人當然不理你

Main Conference (Day 3,4,5,6)

挑幾個我覺得比較重要的talk分享一下：Presidential Speech、Turing Award Panel和Best Paper

Presidential Speech – Will AI write the scientific papers of the future ? (Yolanda Gil)

AAAI 主席認為，未來勢必會通過AI來輔助學術研究，兩個原因

論文太多，新的研究很難涵蓋到所有的相關文獻，導致研究品質下降（是否已經和目前最好的方法對比？沒有人作過相同的研究工作嗎？）
資料太多，人類難以從中發現insight，並遷移到其他領域（例如：基因X對肺炎A有幫助，是否對肺炎B也能有幫助？相關證據？）

提出的解決方法是：將A研究拆解成幾個子components，再透過推理應用到B領域、有相同需求的問題上。我理解起來，其實講的就是KDD(IE) + Reasoning + Transfer/Meta Learning。

Turing Award Panel (Geoffrey Hinton Yann Lecun and Yoshua Bengio)

如果這次AAAI只選擇聽一場演講，那你絕對不能錯過Turing Award Panel（影片連結）

Geoffrey Hinton – Stacked Capsule Autoencoders (SCAE = Capsules 2019)

Hinton等人在NeurIPS 2019提出了SCAE，Capsule的核心思想用一句話概述：將結構引入神經網路中，並通過符號來推理，具體實現是通過Set Transformer來學習集合中各個元素的pair-wise關係。SCAE由P(Part)CAE 和 O(Object)CAE 所組成，其中Object-Part-relationship 是視角不變(invariant)的，Object-Viewer-relationship 是視角同變的(equivariant)。論文的說法是Unsupervised classification，跟我的研究題目還滿有關係的。

Yann LeCun – Self-Supervised Learning (SSL)

為什麼SSL是未來？LeCun認為，Deep Supervised Learning提供的監督信號太少，因为有標註的資料太少了。Deep Reinforcement Learning提供了適當的監督信號，但只能用於動作定義清晰、每次trail成本低的任務（例如OpenAI Gym等模擬實驗）。SSL通過自監督產生了大量的監督信號，能達到更好的泛化性能。

最後，LeCun也提到了目前研究社群所遇到的挑戰和解法

如何在更少資料/試驗次數上，學的更好？ –> SSL
如何推理？ –> Energy-Based Models with latent variables，將 Reasoning 和 gradient-based method 結合
如何學習複雜/層次的action sequences? –> 目前無解

補個八卦，聽說Lecun在NYU比較沒有同學選他的課程，不知道是不是課程太難還是？

Yoshua Bengio – Deep Learning for System 2 Processing

把諾貝爾經濟學獎得主「快思慢想(Thinking, Fast and Slow)」中的System 1, 2 融入到模型中。其中System 1是直覺、下意識、非語言的(fast, 輕鬆)，而System 2是有意識、邏輯推理、因果關係(slow, 累)。舉個例子，老手開車閒聊是System 1，新手專注開車則是System 2。

Bengio認為，傳統ML模型的IID假設太簡單了，造成現在AI模型在真實世界的實踐效果不好。為了要提昇模型在真實世界 out-of-distribution (OOD) 樣本上的泛化能力，必須提昇模型System 2 的能力。System 2 中最具代表性的方法為attention，而Bengio提出了consciousness prior的概念，認為比attention更高級的是consciousness (意識)，實際操作是藉由Sparse factor graph來實現此概念。

Sparse factor graph的核心想法是decompositing/factorizing knowledge。舉個例子，假設今天一個人戴了眼鏡，應該只需將他在factor graph中將對應的「眼鏡」節點改變（如下圖），而非戴了眼鏡之後，模型就完全不認識這個人了。

問答環節使用的是Slido網站提問，擷取幾個好玩的QA內容
Q: 為什麼Hinton之前幾年都很少來AAAI？
A: AAAI is mean to me! （Hinton對Bozeman machine仍念念不忘，可能被拒過多次稿吧 XD）

Q: 沒有取代gradient-based的方法？大腦有gradient嗎？
A: 不清楚，但有時候Reading rot mind，要嘗試獨立思考解決方式

Q: 如何看待AI DDL-driven的灌水式投稿？
A: 論文灌水是惡性循環，要獎勵高品質研究

Q: 做AI是科學嗎？
A: 是！Engineer Science，中世紀也是先有蒸汽機、後有蒸氣動力學。

Best paper Award
今年的Best paper 頒發給AI2所提出的NLP推理新任務，號稱進階版的Turing test。在原有的Winograd基礎上，構建了一個大規模的常識推理數據集WinoGrande (Grande = 大杯)，同時移除容易學到虛假線索和bias的題目，有點類似指代消歧任務，見下圖範例。

個人心得

總結一下，我在這次AAAI會議的感想：

圖靈獎的talk最重要！三個人的演講題目其實環環相扣，一定要聽聽
- Geoffrey Hinton： Capsules 2019 –> 解耦模型 (Part和Viewer)、Self-supervised
- Yann LeCun：Self-supervised –> 解耦模型 (Energy-Based Models with latent variables)
- Yoshua Bengio：Consciousness prior –> 解耦模型 (Sparse factor graph)
大規模Pre-train –> 小規模Re-train(創新點) –> Fine-tune 逐漸成為顯學，例如在Re-train階段融入了外部的knowledge，就變成一篇漂亮的knowledge-grounded xxx…
熱門關鍵字：Casual inference、Neuro-symbolic、Explainability、Fairness、Robustness…

截圖 2020-05-20 下午9.59.01 — 好吃但貴鬆鬆的紐約食物，那個貝果超好吃

另外還有一些我個人的心得感觸

Remote presentation的體驗極差。都是錄好的影片，很明顯會場的人都相對性致缺缺。我認為至少得做到直播＋實時雙向互動 (像Twitch那種），才會有可能成功
Oral > Poster。除了少數Invited talk之外，幾乎都沒有錄影。不過幸好Oral和Poster的presentation時間本來就是分開的，影響還相對比較小。
主動認識 > 被動聽講。這次認識了MIT的台灣博士生、Time series博士生、PyOD作者、UCSD Non-collaborate對話組、NTU Vivian組…等，這些反而是讓我覺得收穫更大的一部分。
善用吃飯時間認識新朋友。盡量找朋友 or 朋友的朋友一起去吃飯聊天，絕對會有意想不到的收穫。而在 AAAI 這種 top conference 舉辦期間，很多企業會有免費的Invited Lunch (這次去了Jane street, Sony的)，沒事的話可以踴躍參加，這也讓我第一次在紐約吃到了Google Map $$$的餐廳。我還有幸參加了Lunch with Fellow的活動，和IBM Deep Blue的作者Murray Campbell共進午餐，不過他似乎很鄙視現在的deep learning，覺得很多研究都在亂搞 XD。
線上/線下宣傳很重要。有一個活動台灣似乎比較少舉辦類似的，之前在北京的時候，我擔任了兩場 AAAI 預講會的講者(北京大學＆阿里巴巴)，預講會讓有中AAAI論文的人在出國前，有機會用中文展示自己的研究工作，不僅能讓更多人知道自己的研究工作，也能結識更多人。

最後，附上一些個人的小murmur：

紐約吃飯真的貴。餐廳平均20刀，還要外加8%紐約州稅、15~20%小費…
時差在飛機上就要先調整好。這次去程調了三天，回程也調了三天…
會場休息位置太少了，大家像難民一樣席地而坐
點心和咖啡居然會中斷！大家可是付了將近3萬台幣的會議註冊費呢…
- AAAI不含早餐＆午餐。10點早茶、3點下午茶，晚上Poster有簡單晚餐。
我的手機不支援美國的4G頻段，每天都處於幾乎斷網的情況。幸好紐約地鐵、公共WIFI的覆蓋率高，才能順利活下來。
AAAI Reception/Social Event 超級無聊，只有一堆不知道該如何吃的神祕cheese。我懷念去年ACL在義大利的舞池和煙火了
來紐約一定要去百老匯看音樂劇！TKTS 半價票超划算，位置超棒，歌劇魅影好好看阿阿阿阿。
在紐約的地鐵內，什麼事情都可能發生 (第一次搭的時候剛好是下雨天，給我的第一印象是：為什麼這裡可以比印度地鐵還要髒…)
路上四處都飄著大麻的味道，味道有夠濃

截圖 2020-05-20 下午10.02.06 — 出來開會(x) –> 出來旅行(O)

以上大概就是這次去開會的心得，因為忙著弄畢業論文拖到現在才整理，希望大家有所收穫！
（我另外有1hr的分享版PPT，有興趣的可以找我要）

TNLIN

永遠保持好奇心

AAAI 2020 參會心得

前言

介紹

Tutorial, Workshop (Day 1,2)

Main Conference (Day 3,4,5,6)

個人心得

對「AAAI 2020 參會心得」的想法

發表留言取消回覆

前言

介紹

Tutorial, Workshop (Day 1,2)

Main Conference (Day 3,4,5,6)

個人心得

覺得不錯的話，歡迎把文章分享出去讓更多人知道:

相關

對「AAAI 2020 參會心得」的想法

發表留言 取消回覆

發表留言取消回覆