關注 >   >  正文

        科研工作者福音!巴西科學家研發新的NLP框架來自動提取論文數據

        評論

        巴西塞阿拉聯邦大學最近發表的一篇論文預印本中提供了一個新的自然語言處理框架來自動化從科學數據中總結和提取核心數據。

        對于科研工作者來說,日常工作中有相當大一部分的內容是通過搜索檢閱相關論文,并摘取其中的有效信息。然而,閱讀一篇論文并提煉中與自己研究工作相關的內容需要大量的精力,而閱讀幾十篇論文更是不易。在這項研究當中,研究團隊提出了一種基于機器學習(ML)的自然語言處理(NLP)方法,能夠自動識別并從文章的語料庫中提取分類和數字參數。

        該方法(命名為a.RIX)通過同時/互換使用ML模型,如神經元網絡(NN)、潛在語義分析(LSA)、天真貝葉斯分類器(NBC)和使用正則表達式(REGEX)的模式識別模型來操作。

        為了測試a.RIX引擎的效率,研究團隊使用了一個由7,873篇涉及天然產品(NPs)的科學文章組成的語料庫來進行測試。該引擎自動提取分類和數字參數,如(i)提取活性分子的植物種類,(ii)活性分子可以對付的微生物種類,以及(iii)對這些微生物的最小抑制濃度(MIC)值。這些參數的提取不需要語音標記(POS)和命名實體識別(NER)方法(即不需要文本注釋),模型的訓練是在無監督下進行的。這樣一來,a.RIX基本上可以用于任何科學領域的文章。

        前瞻經濟學人APP資訊組

        論文原文

        https://arxiv.org/ftp/arxiv/papers/2107/2107.14638.pdf

        標簽: 科研 科研工作 工作者 福音

        今日熱點

        熱點排行

        最近更新

        所刊載信息部分轉載自互聯網,并不代表本網贊同其觀點和對其真實性負責。郵箱:5855973@qq.com

        聯系我們| 中國品牌網 | 滬ICP備2022005074號-18 營業執照  Copyright © 2018@. All Rights Reserved.

        97se亚洲综合在线| 亚洲精品无码专区在线播放| 亚洲人成www在线播放| 精品亚洲成a人片在线观看| 亚洲国产婷婷六月丁香| 久久久久久久亚洲精品| 中文字幕亚洲专区| 亚洲精品尤物yw在线影院| 亚洲国产成人精品久久久国产成人一区二区三区综 | 韩国亚洲伊人久久综合影院| 亚洲变态另类一区二区三区| 亚洲乱码国产乱码精华| 亚洲国产成人久久一区二区三区| 亚洲日韩av无码中文| 亚洲欧美中文日韩视频| 亚洲爆乳无码精品AAA片蜜桃| 亚洲AV无码国产精品永久一区| 亚洲av无码有乱码在线观看| 国产精品亚洲二区在线| 亚洲精品和日本精品| 国产亚洲欧洲Aⅴ综合一区| 国产亚洲一区二区手机在线观看| 人人狠狠综合久久亚洲88| 久久久久亚洲av无码专区蜜芽| 亚洲午夜精品一区二区| 亚洲欧洲日韩国产| 亚洲字幕AV一区二区三区四区| 亚洲爆乳大丰满无码专区| 亚洲精品人成无码中文毛片 | 亚洲综合激情六月婷婷在线观看| 亚洲毛片免费观看| 亚洲成A人片在线播放器| 欧美日韩亚洲精品| 亚洲一区日韩高清中文字幕亚洲| 亚洲欭美日韩颜射在线二| 亚洲电影中文字幕| 亚洲伊人久久大香线蕉啊| 亚洲日韩av无码中文| 亚洲国产一级在线观看| 亚洲国产精品特色大片观看完整版 | 亚洲AV无码一区二区二三区入口 |