AS GPU Cloud

資料科學種子研究計畫從 2017 年啟動,我們希望能透過此計劃推動院內的資料科學發展及在各領域的基礎或應用研究計畫,尤其是能與本院的特色研究結合之領域。同時,在地質、氣象、空污、地震、生態、交通、都市規劃等等,都是以資料為重,且有台灣特色的領域,若能在此時儘快讓研究人員投入以資料及機器學習為導向的研究,對各領域的研究可帶來新的契機及幫助。

從 2017 年至今,人工智慧技術出現突破性的發展,因為資料量夠大,再加上運算速度的提升,讓機器學習有能力,找出比人類說得出口的規則更加精準的規則,也因此,我們可以機器學習來找出資料背後潛藏的規則,解決許多以前無法解決的問題,不論在生醫、物理、化學、農業、工程及社會科學等等領域,都有讓人驚豔不已的成果出現。

機器學習技術又包含傳統機器學習與深度學習。兩者的差別是,深度學習技術所計算出來的規則是有層次的,而傳統機器學習的產出皆是單一層次的規則。例如線性迴歸或決策樹就屬於傳統機器學習。相較於傳統機器學習,深度學習需要的資料量較大,運算量的需求也更為龐大,但好處是它可以自動淬取特徵,因為省掉人為進行特徵工程的步驟,對於高維度的問題也不怕。

凡是涉及文字、影像、聲音、影片等問題通常皆是高維度的問題,當然,許多學術問題本身也具有高維度,或是各種涉及控制的問題,若有足夠的資料量,深度學習通常可以提供比傳統機器學習更好的解答。也因此,深度學習是目前人工智慧的主流技術,舉凡我們最近所見的臉部辨識、語音辨識、無人車等等,幾乎都是深度學習技術的成果。

深度學習自然也有它的極限,一方面它需要大量的資料才能表現得好,另一方面它所需的運算量非常地大,要建立一個 CNN (Convolutional Neural Networks) 模型,訓練時間長達十個小時不算少見。也因此,我們需要高效能的運算平台才能讓同仁們有夠有效率地進行研究。

綜上原因,資料科學種子研究計畫特別向院方申請預算建置 AS GPU Cloud,供院內研究人員進行以深度學習為基礎的學術研究。目前 AS GPU Cloud 約有 150 片左右 GPU ,即日起開放申請,隨到隨審,希望能大大加速院內同仁們的研究。

申請辦法

  • 申請資格:院內研究人員 (PI)
  • 申請方式: 由 PI 提出申請,填妥申請表格,資料科學種子研究計畫辦公室將在一周內以 email 回覆申請結果。
    • 申請資料將進行形式審查,用意為確保資源被妥善使用。
    • 為充份使用 GPU 資源,本平台限用於深度學習模型訓練及測試,不受理資料分析或傳統機器學習專案申請。
    • PI 需提出:
      1. 計畫名稱
      2. 計畫摘要
      3. 預計使用的深度學習模型或方法
      4. 計畫經費來源
  • 可用資源:
    • 程式語言: Python
    • 深度學習程式庫: Keras, TenserFlow, PyTorch
    • 因資源有限,每位 PI 同時限兩個計畫申請使用 AS GPU Cloud.
    • 每個計畫配置一個使用者帳號 (可多重登入),提供 250 GB 硬碟空間及同時至多 2 顆 GPU。
    • 為強化資源配置效率,每個計畫使用期限為一年,期限後若仍有需求,需重新申請。
  • 資源調配:
    • 若申請計畫過多,每計畫 GPU 可用數量可能動態調整。
    • 若申請計畫數量已超過本平台 GPU 數量,將依以下優先順序受理申請:
      • 資料科學關鍵突破(種子)計畫
      • 院內補助計畫
      • 科技部或其它政府單位補助或合作計畫
      • 其它院外單位補助或合作計畫

填寫申請表

第一次使用本平台之前,請務必閱讀使用手冊,如有更多問題,請至 FAQ 查詢相關疑難排解。

其它問題請來信至 gpu@sinica.edu.tw

資料科學種子研究群網站 http://ds.sinica.edu.tw

107 年度資料科學關鍵突破種子最終核定名單

核定計畫列表


107 年度資料科學種子研究計畫共 9 件核定

執行期間至 107 年 12 月 31 日止

專案名稱 計畫主持人 所處
揭露、潰散「暗網」勢力 江彥生 社會所
以深度學習機制解析巨量腸病毒序列資料並建立基因型鑑別機制與網路即時分析平台 林仲彥 資訊所
深度傾聽極端天氣下的生物多樣性 端木茂甯 生多中心
性狀如何影響生物在氣候變遷下的脆弱程度 沈聖峰 生多中心
Fusing high‐accuracy energetics calculations and deep‐learning approaches for more effective virtual drug screen 林榮信 應科中心
利用多外表型為基礎之全基因體研究發展泛自閉症之精準診斷與治療 楊欣洲 統計所
老年人自主健康管理運動疲勞雲端偵測系統與大數據分析 劉長萱 統計所
以機器學習進行隱私資料去識別化之技術 黃彥男 資創中心
智慧機械運用人工智慧演算方法於製造產業鏈技術精進計畫 廖弘源 資訊所

資料科學關鍵突破計畫 – 計畫說明會實況

資料科學關鍵突破計畫重要時程表如下,初審採書面審查,複審採簡報審查,若初審通過後,將另行通知複審。
**複審會議訂於 12/05 (二) 下午 2 點召開,敬請保留該時段,以利進行複審簡報。

日期 活動
2017/11/13 (一) 計畫說明會 / 2pm – 3pm於資訊所新館 106 會議室
2017/11/24 (五) 計畫申請截止
2017/12/01 (五) 初審結果公告
2017/12/05 (二) 計畫複審會議,將邀請通過初審之計畫團隊進行口頭簡報及答詢 / 預計2pm 開始,地點為資訊所新館 107 會議室
2017/12/18 (一) 複審結果公告
2018/01/01 (一) 計畫執行開始

貼心提醒 : 本計畫申請將於 2017/11/24 (五) 截止 (徵求書)

資料科學關鍵突破計畫說明會於 11/13 (一) 在資訊所 106 室會議室舉辦,現場約有二十多位的院內同仁參與。

107 年度資料科學關鍵突破計畫重要時程

日期 活動
2017/11/13 (一) 計畫說明會 / 2pm – 3pm於資訊所新館 106 會議室
2017/11/24 (五) 計畫申請截止
2017/12/01 (五) 初審結果公告
2017/12/05 (二) 計畫複審會議,將邀請通過初審之計畫團隊進行口頭簡報及答詢 / 預計2pm 開始,地點為資訊所新館 107 會議室
2017/12/18 (一) 複審結果公告
2018/01/01 (一) 計畫執行開始

中央研究院 107 年度資料科學關鍵突破計畫徵求書

本院「107 年度資料科學關鍵突破種子計畫」及「107 年度資料科學關鍵突破計畫」即日起受理申請,請計畫主持人於 106 年 11 月 24 日前完成申請作業,逾期恕不受理。

資料科學 (Data Science) 是結合資訊、統計、及各領域的技術及應用,近年來由於機器學習 (Machine Learning) 及人工智慧 (Artificial Intelligence) 技術的快速進展,已在許多領域都有重要的突破。近期 Google AlphaGo 打敗圍棋高手,自動駕駛車的出現,以及將機器學習用來自動判讀病理切片、甚至根據網路上的發言來判斷是否有躁鬱症及自殺傾向等等,都是已實現或即將實現的技術,因此世界各國不論業界、學界均大量投入對人工智慧技術與應用之研發,以期未來在各界競爭之下能取得領先之地位。

我們希望能透過資料科學關鍵突破種子計畫及關鍵突破計畫來推動院內的資料科學及人工智慧在各領域的關鍵基礎與應用研究;同時,推動院內外資料擁有者與資料分析專家之間的交流及合作,從院內同仁與產官學界的實質合作開始,帶動深度及智慧的資料運用,培育人才,解決人類社會的重大挑戰以及增進社會福祉。

補助原則

  1. 本計畫得提出申請之主持人為全院研究人員,可單獨申請。共同主持人可為院內外符合科技部專題研究計畫主持人資格之學者專家。計畫經費由計畫主持人統籌管理並核銷。
  2. 關鍵突破種子計畫之經費上限為每件新臺幣 100 萬元,申請不受院內其它計畫 ( 如主題、永續、深耕、前瞻等計畫 ) 的件數限制,惟每位研究人員每年以主持人身份執行至多一件資料科學關鍵突破種子計畫為限。
  3. 關鍵突破計畫經費無規範上下限,請依計畫合理需求編列,計畫辦公室將依各計畫之需求,在合理的範圍內予以補助。關鍵突破計畫不受到本院執行計畫件數限制。獲深耕計畫或前瞻計畫補助者,則依循該計畫件數規定辦理。
  4. 關鍵突破種子計畫之執行期限自 107 年 1 月 1 日起至 107 年 12 月 31 日止。關鍵突破計畫之執行期限同樣由 107 年 1 月 1 日開始,最長可至 109 年 12 月 31 日止。
  5. 同一研究主題只限申請關鍵突破種子計畫或關鍵突破計畫之一。106年度的資料科學種子計畫執行團隊可選擇申請任一種計畫。

計畫審查

  1. 關鍵突破種子計畫及關鍵突破計畫將以是否著眼重大挑戰提出突破性的方案為評估基準,並應具備下列重點:
    (一) 著眼於下世代科學及人類社會所面臨的重大挑戰。
    (二) 剖析現有的限制。
    (三) 發掘關鍵問題之所在。
    (四) 提出具突破性的研究方案。
    (五) 國際競爭力分析。
  2. 關鍵突破種子計畫著重在潛在影響力原創性,關鍵突破計畫則強調有更大的格局,以解決學術研究或社會重大挑戰為目標。原則上關鍵突破種子計畫也可視為關鍵突破計畫的先導計畫,用以探索及確認關鍵問題及突破性方案。
日期 活動
2017/11/13 (一) 計畫說明會 / 2pm – 3pm於資訊所新館 106 會議室
2017/11/24 (五) 計畫申請截止
2017/12/01 (五) 初審結果公告
2017/12/05 (二) 計畫複審會議,將邀請通過初審之計畫團隊進行口頭簡報及答詢 / 預計2pm 開始,地點為資訊所新館 107 會議室
2017/12/18 (一) 複審結果公告
2018/01/01 (一) 計畫執行開始

計畫申請人媒合

本計畫鼓勵領域專家與資料專家之間的跨域合作,因此,計畫辦公室提供媒合服務,希望能幫助有意願的申請人找到專長及資源相符的合作伙伴。意者請填寫「資料科學關鍵突破計畫媒合申請表格」,我們將會儘可能地提供潛在的合作伙伴資訊給您。此媒合活動將長期進行,以利持續性地媒合有意願合作的計畫申請人及早預備,為未來的資料科學研究計畫申請做準備。

資料科學關鍵突破計畫媒合申請表格:
https://docs.google.com/forms/d/e/1FAIpQLSfSaR4t8XkAhoO5R671uEWYAprzu9KBBPgzpZJ7GIqfgjIwbw/viewform

媒合聯絡人:資訊所王瑞希女士,電話:27883799#1668

申請方式

請備妥研究計畫書 ( 除經費申請表及封面外,至多 5 頁 ) 及計畫說明簡報 ( 1 頁,不拘格式 ),在計畫申請期限內寄至 datasci@gate.sinica.edu.tw,承辦同仁將回信確認。

  • 關鍵突破種子計畫書 ( 107 年 1 月 1 日起至 107 年 12 月 31 日止):請使用樣版文件,主文至多五頁。下載
  • 關鍵突破計畫書 ( 107 年 1 月 1 日起,最長可至 109 年 12 月 31 日止):請使用樣版文件,主文至多五頁。下載

計畫申請聯絡人:

學術及儀器事務處專員  黃文櫻,電話:27899850
資訊所王瑞希女士,電話:27883799 #1668

網站公告

計畫辦公室網站為 http://ds.sinica.edu.tw/  我們將在此網站上維護所有與資料科學相關計畫的消息與資訊。有任何問題或建議也請不吝與我們連絡。

中央研究院資料科學種子研究計畫期末成果發表會

中央研究院資料科學種子研究計畫期末成果發表會

時間:2017年12月4日 下午 1:30 至 5:00

地點:中央研究院人文社會科學館第一會議室及第二會議室

報名方式:https://dsc.kktix.cc/events/ds106

* 形式:每個計畫報告 20 分鐘,分為兩個會議室進行成果發表。

2017/12/4 (一) 人文館第一會議室
時間 名稱
1:30pm – 1:50pm 資料探勘行動訊號軌跡與城市脈動 – 運用資料探勘技術探索動態人口與社會經濟活動之關係
1:50pm – 2:10pm A real – time music transcription system for music education and enriched concert performance
2:10pm – 2:30pm ExCALIBUR: Education by Cloud – computing Assisted Learning and Instruction for Balancing Urban – rural Resources
2:30pm – 2:50pm 智慧型工具機主軸狀態監測與異常診斷系統技術研發計畫
2:50pm – 3:10pm Query Forecasting: Identifying Critical Learning Queries
3:10pm – 3:40pm 茶點及交流時間
3:40pm – 4:00pm 法律大數據的開發應用: 車禍責任的法官行為分析與資料科學的現實應用
4:00pm – 4:20pm 資訊可變標誌 (CMS) 資料之文字探勘: 高速公路交通壅塞特性分析
4:20pm – 4:40pm Styles in Contemporary Art: A Network Approach
4:40pm – 5:00pm 結合生成式與監督式之深度學習網路以增進分類與檢索效能

 

2017/12/4 (一) 人文館第二會議室
時間 名稱
1:30pm – 1:50pm 運用台灣生物銀行資料庫搜尋台灣人的心臟血管疾病及危險因子基因標記發展心臟血管疾病之風險預測模型
1:50pm – 2:10pm 解構環境聲音 – 以聲音監測環境變遷下的生物多樣性
2:10pm – 2:30pm 開發深層學習統計聚類方法以建構冷凍電顯影像大數據分析平台
2:30pm – 2:50pm 天文學新世代數據的統計分析方法
2:50pm – 3:10pm 氣候變遷下昆蟲體色與溫度調節的整合研究
3:10pm – 3:40pm 茶點及交流時間
3:40pm – 4:00pm 新世代高通量生物學的雲端分析工具箱 Cloud – based Open Toolbox for Data Intensive Biology
4:00pm – 4:20pm 不孕症療程資料研究計畫
4:20pm – 4:40pm 知識圖譜深度編碼之研究
4:40pm – 5:00pm 老年人自主健康管理: 運動效率與品質雲端偵測系統與大數據分析

中央研究院機器學習月活動

報名方式: 請於 106 年 9 月 8 日 (星期五) 11:59pm 前至以下網址報名。

請至 https://dsc.kktix.cc/events/ml-month-2017-asstaff-cc4ca8 報名。名額有限,額滿為止。

日期 時間 活動 講者 地點
2017/09/12 (二) 10am – 12pm Social Physics: Toward A Computational Understanding of Society Prof. Alex “Sandy" Pentland / MIT, UN Global Partnership for Sustainable Development Data 人文館國際會議廳
2017/09/19 (二) 9:30am – 12:30pm 為什麼科學家一定要懂機器學習? 陳昇瑋教授 / 中研院資訊所 人文館國際會議廳
2017/09/19 (二) 2pm – 5pm 快速上手 Python 機器學習實務 張鈞閔先生 / 中研院資訊所 人文館第二會議室
2017/09/27 (三) 9:30am – 12:30pm 快速上手深度學習實務 游為翔先生 / 中研院資訊所
楊証琨先生 / 中研院資訊所
人文館第二會議室

中央研究院 AI 月活動

報名方式:請於 106 年 7 月 11 日 (星期三) 11:59pm 前至以下網址報名。
1.院外人士:https://dsc.kktix.cc/events/ai-month-2017
2.中研院員工:https://dsc.kktix.cc/events/ai-month-2017-asstaff ( 報名時間:6 月 16 日(五) 12:00pm 起 ),特殊票僅供本活動相關工作團隊申請之團隊使用。

** 原訂於 7/12 (Wed) 2pm-3pm 發表的 “Data Science – Modern Computational Foundation of Artificial Intelligence" 演講,由於講者莊炳湟院士因故無法到場,我們特別邀請中央研究院資訊科學研究所許聞廉特聘研究員兼所長於原訂時間地點分享同樣精采的演講,主題為「自然語言理解-人工智慧的最終關卡」。若議程變更造成您的不便,敬請見諒。

日期 時間 活動 講者 地點
2017/07/05 (三) 9am – 12pm 從大數據走向人工智慧 陳昇瑋教授 / 中研院資訊所 人文館國際會議廳
2017/07/12 (三) 9am – 12pm 深度學習初探 李宏毅教授 / 台大電機 人文館國際會議廳
2017/07/12 (三) 12pm – 2pm 人工智慧跨域交流餐會:當生醫科學遇上人工智慧 人文館四樓空間
2017/07/12 (三) 2pm – 3pm **Data Science – Modern Computational Foundation of Artificial Intelligence 莊炳湟院士 / George Tech 人文館國際會議廳
2017/07/12 (三) 3:20pm – 4:20pm Smart Radios for Smart Life 劉國瑞教授 / Univ. Maryland 人文館國際會議廳
2017/07/19 (三) 9:30am – 4:45pm 資料科學前瞻研究研討會 詳見議程 資訊所 106 演講廳
2017/07/26 (三) 9am – 12pm 電腦視覺初探 陳彥呈博士 / Viscovery 人文館國際會議廳
2017/07/26 (三) 2pm – 5pm 快速上手 Python 機器學習實務 張鈞閔先生 / 中研院資訊所 人文館第二會議室

中央研究院 AI 月活動-7/19 資料科學前瞻研究研討會

資料科學前瞻研究研討會 (The Inaugural Academia Sinica Data Science Frontiers Workshop)

時間: July 19 (Wed)

地點: 中央研究院資訊科學研究所 106 演講廳及 101 會議室

報名方式:請於 106 年 7 月 3 日 (星期一) 前至網址:https://dsc.kktix.cc/events/ai-month-2017  報名。

July 19 Wednesday
Time Activity Place
09:30am – 10:15am Why AI is indispensable for biomedical research? – From a viewpoint of cancer genomic medicine
Prof. Satoru Miyano, Human Genome Center, Institute of Medical Science, The University of Tokyo
Auditorium 106 at IIS
10:15am – 10:40am Coffee Break
10:40am – 11:25am On Mining Big Data: A Fusion Perspective
Prof. Philip Yu, UIC Distinguished Professor and Wexler Chair in Information Technology, Department of Computer Science, University of Illinois at Chicago
Auditorium 106 at IIS
11:25am – 12:10pm Why Deep Learning Networks Work So Well
Prof. Jay Kuo, Media Communications Lab, University of Southern California
Auditorium 106 at IIS
12:10pm – 01:30pm Lunch Break
01:30pm – 03:45pm Progress Reports & Discussion
(by the PIs of 18 funded projects, 15 minutes each, two parallel sessions)
Auditorium 106 and Seminar Room 101 at IIS
03:45pm – 04:15pm Afternoon Tea Break & Social Networking Open space at 1F, IIS
04:15pm – 04:45pm Brainstorming Session Auditorium 106 at IIS

106 年度資料科學種子研究計畫最終核定名單

核定計畫列表


106 年度資料科學種子研究計畫共 18 件核定

執行期間至 106 年 12 月 31 日止

類別 計畫名稱 1.計畫主持人
2.共同主持人
3.產業合作對象
4.協同主持人
執行單位
產學 資料探勘行動訊號軌跡與城市脈動 – 運用資料探勘技術探索動態人口與社會經濟活動之關係 1.詹大千
3.遠傳電信股份有限公司系統整合分公司
中央研究院人文社會科學研究中心
產學 A real – time music transcription system for music education and enriched concert performance 1.蘇黎
3.財團法人國際沛思文教基金會
資訊科學研究所
產學 ExCALIBUR: Education by Cloud – computing Assisted Learning
and Instruction for Balancing Urban – rural Resources
1.張源俊
3.誠致教育基金會
中央研究院統計科學研究所
產學 智慧型工具機主軸狀態監測與異常診斷系統技術研發計畫 1.黃彥男
3.永進機械工業股份有限公司
中央研究院資訊科技創新研究中心
產學 不孕症療程資料研究計畫 1.王大為
3.沛智生醫科技股份有限公司
中央研究院資訊科學研究所
產學 Query Forecasting: Identifying Critical Learning Queries 1.王志宇
3.香港商雅虎資訊股份有限公司臺灣分公司
中央研究院資訊科技創新研究中心
創新 法律大數據的開發應用: 車禍責任的法官行為分析與資料科學的現實應用 1.張永健
1.蔡恆修
中央研究院法律學研究所
中央研究院統計科學研究所
創新 解構環境聲音 – 以聲音監測環境變遷下的生物多樣性 1.端木茂甯
1.李宏毅
2.嚴漢偉
中央研究院生物多樣性研究中心
國立台灣大學電機工程學系
中央研究院網格與科學計算專題中心
創新 開發深層學習統計聚類方法以建構冷凍電顯影像大數據分析平台 1.陳定立
1.章為皓
2.陳素雲
中央研究院統計科學研究所
中央研究院化學研究所
中央研究院統計科學研究所
創新 資訊可變標誌 (CMS) 資料之文字探勘: 高速公路交通壅塞特性分析 1.丘政民
1.陳菀蕙
中央研究院統計科學研究所
淡江大學運輸管理學系
創新 天文學新世代數據的統計分析方法 1.杜憶萍
1.林彥廷
2.須上英
中央研究院統計科學研究所
中央研究院天文及天文物理研究所
國立臺北大學統計系
創新 老年人自主健康管理: 運動效率與品質雲端偵測系統與大數據分析 1.劉長萱
1.吳育德
2.王伯山
2.蔡志鑫
中央研究院統計科學研究所
國立陽明大學生醫光電研究所
臺北市立關渡醫院神經內科
中央研究院統計科學研究所
創新 氣候變遷下昆蟲體色與溫度調節的整合研究 1.沈聖峰
2.賀耀華
生物多樣性研究中心
國立師範大學資訊工程學系
創新 新世代高通量生物學的雲端分析工具箱 Cloud – based Open Toolbox for Data Intensive Biology 1.林仲彥
2.呂美曄
中央研究院資訊科學研究所
中央研究院生物多樣性研究中心
創新 運用台灣生物銀行資料庫搜尋台灣人的心臟血管疾病及危險因子基因標記發展心臟血管疾病之風險預測模型 1.潘文涵
2.張新儀
4.楊欣洲
4.華國媛
中央研究院生物醫學科學研究所
國家衛生研究院群體健康研究所
中央研究院統計科學研究所
臺北科技大學分子科學與工程系
創新 Styles in Contemporary Art: A Network Approach 1.顏佐榕
2.李宗榮
中央研究院統計科學研究所
中央研究院社會學研究所
學知 結合生成式與監督式之深度學習網路以增進分類與檢索效能 1.陳祝嵩 中央研究院資訊科學研究所
學知 知識圖譜深度編碼之研究 1.古倫維 中央研究院資訊科學研究所