題目:大數據的多粒度分析與挖掘研究
報告人:同濟大學苗奪謙教授(國際粗糙集學會指導委員會主席)
時間:4月29日14:30~16:00
地點:文理學院1C323
內容摘要:大數據的研究涉及數據的采集、傳輸、存儲、分析與利用,每個方面都有挑戰性科學問題,但我認為大數據的智能分析與利用應是當前研究的重點。因為有效的分析與挖掘,可以極大地壓縮數據的規模、簡化數據的結構,當我們把分析與挖掘前置后,將有利于大數據的傳輸和存儲。各種傳感器采集的原始數據,是我們可以分析與利用的最細粒度的數據,由于粒度太細,所以規模可能巨量,而且呈現不出結構。數據中蘊含著信息(知識),信息中蘊含著智慧。信息不是單粒度的,而是多粒度的。當大數據提升到不同抽象層時,會呈現出不同的規律(即信息),而這些信息需采用不同的表達形式,同時,數據的規模極大地減小。多源數據(圖像、視頻、音頻、文本等)通常是異構的,我認為異構數據在細粒度上很難融合,只有把它們提升到高層信息的時候,是容易融合的。不同領域的數據,比如,生物組學數據、監控視頻數據、Web數據等都具有不同粒度表達、不同粒度分析、不同粒度利用的問題,這是一個共性的問題。數據產生的速度越來越快,通過存儲與傳輸技術的進步解決大數據問題有一定作用,但本質上解決該問題,需要模擬人類的智能,學會記憶與遺忘,而記憶與遺忘的基礎是對大數據的智能分析與處理,應該記憶數據中蘊含的信息(由信息長期凝練、演化得到的智慧),遺忘數據的細節。粒計算(Granular Computing)是大數據智能分析與挖掘的一種有效工具。
主講人簡介
苗奪謙,1964年4月生,1997年于中國科學院自動化研究所模式識別與智能系統專業獲博士學位。現任同濟大學電子與信息工程學院教授、博導、副院長,計算機與信息技術國家級教學實驗示范中心主任,教育部嵌入式系統與服務計算重點實驗室副主任。主要研究方向包括:機器學習、數據挖掘、大數據、文本與圖像理解、粒度計算、Web智能、粗糙集等。在國內外重要學術刊物與會議上發表論文180余篇,其中SCI和EI等收錄80余篇次,出版教材和學術著作9部,授權專利9項。主持國家自然科學基金項目6項,高等學校博士學科點專項科研基金項目2項,作為骨干參與973項目1項,863項目1項,國家自然科學基金重大研究計劃項目1項、重點項目1項;主持并參與省部級自然科學基金與科技攻關項目20余項。曾獲教育部科技進步一等獎(2007)、上海市技術發明一等獎(2009)、重慶市自然科學一等獎(2010)和其它省部級二、三等獎共5項,2010年度教育部-IBM中國優秀教師獎,2011年度寶鋼教育優秀教師獎。目前擔任國際粗糙集學會指導委員會主席,國家自然科學基金委信息學部評議組專家,教育部高等學校計算機科學與技術專業教學指導分委員會專家工作組成員,上海市計算機科學與技術專業指導委員會副主任,中國人工智能學會粗糙集與軟計算專委會主任,上海市計算機學會人工智能專委會主任。