5月3日至8日,中國科學院深圳先進技術研究院可視計算研究中心研究員黃惠帶領副研究員汪云海和博士生鄭倩參加了在瑞士蘇黎世舉辦的EUROGRAPHICS2015。他們代表深圳先進院在這次歐洲圖形國際大會上做了三場學術報告:Skeleton-Intrinsic Symmetrization of Shapes(《骨架驅動的形狀內蘊對稱化》),Distilled collections from textual image queries(《文本圖像搜索的圖像集合提純》)和Mobility-Trees for Indoor Scenes Manipulation(《基于運動樹的室內場景編控》),反響熱烈。
其中EG15論文Skeleton-Intrinsic Symmetrization of Shapes(《骨架驅動的形狀內蘊對稱化》)由鄭倩和黃惠等人完成。文章提出了一個骨架主干(Backbone)的新概念和曲線驅動的形狀內蘊對稱化算法:將一個不大對稱的形狀對稱化同時保持形狀自身的姿勢和動作。該技術成功突破現有對稱檢測方法的局限,可以魯棒揭示各類形狀在幾何上只有微弱近似的內蘊對稱性并實現最終整個形狀的完美對稱化,可以廣泛應用于手繪草圖美化、三維模型拼接、點云補全和從透視圖像中恢復正常形狀等等。
為了幫助在海量網絡圖像搜索中快速找到自己感興趣的物體圖像,汪云海和可視計算外專千人Daniel Cohen-Or在EG15論文Distilled collections from textual image queries(《文本圖像搜索的圖像集合提純》)中提出了一種圖像提純算法,能夠從一個僅基于文本搜索得到的含大量噪聲的圖像集合中全自動提取出高質量的圖像子集,并將提純的圖像子集中的前景物體準確分割出來。該算法同時解決了圖像提純和物體分割兩個重要問題,從而允許用戶在圖像搜索中快速找到自己期待的二維形狀,在當前大熱的大數據搜索引擎中極具實用價值。
與此同時,從ACM SIGGRAPH 傳來捷報,可視計算研究中心今年又有三篇論文入選計算機圖形學TOP ONE 國際會議SIGGRAPH 2015,包括博士后王濱和研究員黃惠等人合作的Deformation Capture and Modeling of Soft Objects(《軟材質物體的形變運動跟蹤與建模》),客座博士生胡瑞珍和研究員張皓等人合作的Interaction Context (ICON): Towards a Geometric Functionality Descriptor(《交互上下文:物體幾何功能描述子的探索》)和Foldabilizing Furniture(《家具模型可折疊化》)。
計算機圖形學技術經過近幾十年的飛速發展,逼真的幾何形狀和炫酷的渲染效果在虛擬現實、影視動畫、電腦游戲等領域得到廣泛應用,但這已經不再是人們關注的唯一焦點。具有真實感的運動生成與控制,以及基于物理原理的交互響應等成為了另一個研究熱點。對于動畫仿真領域,結果好壞極大依賴于建立的數學物理模型和參數設定。然而在實際操作運用中,簡化的模型遠不足以還原真實世界變形物體的運動復雜多樣性,同時繁瑣的人工參數調試也阻礙了動畫技術的產業轉化應用。
王濱和黃惠等人的SIG15文章Deformation Capture and Modeling of Soft Objects(《軟材質物體的形變運動跟蹤與建模》)提出了一種數據驅動的可變形物體運動捕捉和物理建模方法。該技術借助低成本的Kinect掃描儀首次從物體動態運動點云數據中恢復估計物體固有的參考形狀和彈性系數,并建立了一套完整的軟件系統用于生成新的仿真動畫。其創新之處在于不依賴任何傳統的力-位移傳感設備,提出了第一個數據驅動的軟材質物體運動模型生成框架。基于物理的可變形物體運動跟蹤方法能夠魯棒地從帶有嚴重噪聲的不完整點云數據中恢復模型的快速大幅度變形運動,而新穎的分治方法巧妙地計算估計了模型固有參考形狀和物體參數,同時物理仿真與最優化理論相結合的方式高效地求解了這一高維度的非線性問題。一貫要求嚴謹的SIGGRAPH評審一致認為該論文對于可變形物體運動模型參數反演這一復雜問題做出了積極的前沿探索,開辟了新的研究思路。
功能性一直都被作為區分不同種類物體的主要依據,功能性的分析和識別對于物體的理解起到至關重要的作用。胡瑞珍和張皓等人就此發表了SIG15文章Interaction Context (ICON): Towards a Geometric Functionality Descriptor(《交互上下文:物體幾何功能描述子的探索》)。該工作創新性地提出了一個功能描述子,即交互上下文,對物體的功能性進行表達和分析。不同于傳統的物體功能性分析方法,該研究將物體的功能性解釋為物體被使用的方式,即在被使用過程中物體所支持的交互方式,同時采用了一些幾何特征來描述每一個交互作用,并將它們組織形成一個樹狀結構,得到了交互上下文這一新的描述子。通過一系列實驗證明,交互上下文可以通過直接或者補充已有其他幾何描述子的方式被用于功能性相關應用,如基于功能的模型檢索、分割和物體合成等。
現實生活中還存在許多為了節省空間而設計的可折疊家具,而通常這一類家具的設計都需要設計師通過精密計算和反復實驗才能完成。為了幫助設計可節省空間的家具,胡瑞珍和張皓等人提出了三維模型的可折疊化問題,發表了SIG15Foldabilizing Furniture(《家具模型可折疊化》)。給定一個家具模型,該算法可以通過盡量小的形變使它成為可折疊的模型,從而可以通過折疊來節省空間。由于可折疊性的動態特性,可折疊化問題非常復雜,而該論文通過對折疊方式和形變方式做出合理的限制使得該問題可解,同時展示了許多算法實時得到的可折疊化結果,以及一些通過三維打印得到的實體模型來具體體現其算法的實用性。
可視計算研究中心成立于2008年10月,至發稿日已發表高水平學術論文55篇,其中JCR一區論文38篇,包括計算機圖形學SIGGRAPH論文12篇,SIGGRAPH ASIA論文12篇和EUROGRAPHICS論文7篇。
國際知名學術期刊《自然》最新發表一篇人工智能(AI)研究論文,提出并構建了一個超過1萬張人類圖像的數據庫,旨在評估AI模型在以人為本的計算機視覺領域中的偏見。這一“公平的以人類為中心的圖像基準”(FH......
6月28日,國家能源集團在京舉行發布會,正式發布全球首個千億級發電行業大模型——“擎源”。該模型構建了覆蓋安全環保、電力交易、產調中樞、設備檢修全鏈條的智能決策體系,實現電力全場景智慧化升級、模型自主......
近日,中國首個海洋領域開源大模型OceanGPT(滄淵)在杭州正式發布。該大模型由海洋精準感知技術全國重點實驗室(浙江大學)牽頭研發,具備基礎的海洋專業知識問答,以及聲吶圖像、海洋觀測圖等海洋特色多模......
近日,中國熱帶農業科學院南亞熱帶作物研究所旱作農業工程團隊在基于混合監督學習的菠蘿智能識別算法方面取得新進展。該團隊設計了一個基于混合監督學習(MIset)的掩蔽自關注實例分割網絡,以快速提取菠蘿的位......
韓國浦項科技大學領導的研究團隊開發出了一項突破性的超表面技術,能在厚度比人類頭發絲還小的表面上顯示多達36幅高分辨率圖像。這項研究成果發表在新一期《先進科學》雜志上。傳統全息技術在單屏顯示多幅圖像以及......
英國倫敦大學學院和弗朗西斯·克里克研究所的研究人員首次利用延時視頻,捕捉到活體小鼠胚胎心臟開始形成的瞬間,從而確定了心肌細胞的起源。這項突破性成果為理解先天性心臟缺陷的成因及開發新型療法提供了全新視角......
近日,首個可精準診斷罕見病的醫學影像多模態大模型矩陣“明岐”正式亮相。當天,由上海交通大學主辦,上海交通大學計算機學院(網絡空間安全學院)、上海交通大學國際與公共事務學院、健康長三角研究院共同承辦的“......
3月28日至30日,由河海大學、江蘇大學主辦的第四屆圖像、信號處理與模式識別國際學術會議(ISPP2025)在南京舉行。本次會議匯聚行業精英與專家學者,通過大會報告、口頭報告以及海報展示等豐富多樣的環......
國家藥監局藥審中心關于發布《模型引導的創新藥物劑量探索和優化技術指導原則》的通告(2024年第53號)。為推動創新藥物高質量發展,進一步指導我國創新藥物臨床試驗階段劑量探索和優化,藥審中心組織制定了《......
據騰訊官微消息,騰訊今日宣布,混元大模型上線并開源文生視頻能力。據介紹,該模型參數量為130億,已經在HuggingFace平臺及Github上發布,包含模型權重、推理代碼、模型算法等完整模型,可供企......