伊人久久大香线蕉综合網 匯聚海量最新國內、國際資訊

RPA+AI落地,真的難嗎?

2020-05-20已圍觀 來源:互聯網編輯:伊人久久大香线蕉综合網

作者|胡一川 來也科技CTO

RPA(機器人流程自動化)將原本需要人工重複執行的軟件操作交給機器人執行,能夠極大地幫助企業降低成本、提升效率,成為推動企業數字化轉型的利器。

但是,傳統RPA隻能實現基於規則的流程自動化,應用場景相對受限。借助AI之後,RPA機器人則能具備感知和認知能力,將自動化拓展到更複雜的業務流程,產生更大的價值。

不過,RPA+AI,這聽起來十分美好,但在實際場景中又該如何落地?

本文會從技術角度對RPA和AI進行分析,並結合來也科技在RPA+AI方麵的實踐,談談如何破局,並對未來進行展望。

兩種軟件開發範式

本質上來講,RPA和AI屬於兩種截然不同的軟件開發範式。

RPA是基於規則的軟件開發範式,每一行代碼都對應真實場景中的業務邏輯。因此,開發RPA機器人前,首先要梳理清楚業務流程,然後根據業務流程去編寫代碼。

AI則是一種全新的軟件開發範式。在這種範式下,開發者不再需要用代碼去編寫規則,而是用代碼編寫機器學習模型,然後用數據來訓練這個模型,最後軟件基於模型的輸出去完成特定的任務。

簡單的說,RPA開發是給機器明確的指令每一步該做什麽,AI開發是教機器過去是怎麽做的,讓機器去學習並舉一反三。

RPA和AI屬於兩種不同的軟件開發範式(左圖:RPA流程的源代碼視圖;右圖:AI訓練神經網絡參數)

開發範式的不同會帶來一係列的後果,這導致RPA+AI在實際落地中遇到巨大挑戰。

第一,RPA和AI對開發人員的要求不同。RPA的特點是非侵入、低代碼,讓不懂編程的業務人員也能開發流程。而AI模型的訓練則有較高的門檻,通常需要專業的數據科學家或算法工程師才能完成。由於這類人才的稀缺,導致RPA+AI的落地變得很難。

第二,AI的開發周期要比RPA長。RPA強調的是快速落地、快速見效,而AI模型的訓練要經過數據獲取、數據標注、模型訓練、模型部署、模型持續優化等流程。這意味著RPA+AI項目的落地周期會大大加長。

第三,AI的使用成本比RPA高。RPA是客戶端程序,隻要計算機的軟硬件配置和係統環境滿足基本要求,即可運行。AI基於深度神經網絡,對計算、存儲、網絡等都要較高的要求,通常需要運行在GPU服務器上,部署和運維成本不小,這使得RPA+AI項目的前期投入大。

以上幾點,都導致RPA+AI在實際業務中的落地並沒有想象中的容易。

如何破局

不久前,來也科技發布了全新的RPA+AI平台產品——UiBot Mage,這是專為RPA機器人打造的AI能力平台,以拓寬RPA的使用邊界。

UiBot Mage上線後,將與UiBot家族原有的Creator(創造者)、Worker(勞動者)、Commander(指揮官)三大模塊集結,分別為RPA機器人生產、執行、分配、智能化提供相應的工具和平台。

提供開箱即用的AI能力

既然AI模型依賴數據和訓練,第一種破局的思路就是提前把模型訓練好供RPA使用。這個方案的前提是,伊人久久大香线蕉综合要知道RPA需要什麽樣的AI能力。

為此,來也科技深入分析了幾十個業務場景中的幾百個業務流程,從中梳理出RPA最需要的AI能力。伊人久久大香线蕉综合發現,在RPA流程中,最能夠用到AI能力的地方,是對各種非結構化數據的處理。在這些場景中,RPA可以利用文字識別、文本理解等AI能力將非結構化數據進行結構化。

文字識別即伊人久久大香线蕉综合常說的OCR,它可以應用於文檔識別、表格識別、票據識別、卡證識別等垂直場景。UiBot Mage針對每個場景提供若幹個開箱即用的模型。例如,票據識別場景下開箱即用的模型覆蓋了增值稅專用發票、增值稅普通發票、行程單、火車票等20多種票據類型,在卡證識別場景則包括了銀行卡、身份證、護照、營業執照等20多種模型。

此外,UiBot Mage在文本理解方麵也提供一係列開箱即用的模型。以信息抽取為例,伊人久久大香线蕉综合提供的模型支持幾十種常見的實體抽取,包括企業名稱、日期、時間、金額、地址、電話等,能夠應對大多數業務中的信息抽取需求。

以上AI能力的開箱即用還體現在與Creator的無縫集成上。所有AI能力都以自定義命令的形式存在於Creator中,開發者隻需通過拖拽和簡單設置就可在RPA流程中使用AI能力。這樣,沒有任何AI經驗的RPA工程師甚至業務人員,都可以享受到AI給RPA帶來的價值。

通過提供開箱即用的AI能力,UiBot Mage可覆蓋到RPA中常見的需要AI能力的場景。但是,對於長尾的、非標準化的場景,開箱即用的模型無法滿足用戶的需求,因此伊人久久大香线蕉综合需要有新的解決方案。

通過預訓練降低訓練成本

2018年底,Google推出BERT,其核心原理是,用海量數據預先訓練一個基於深度神經網絡的語言模型,然後針對特定NLP任務在原網絡的基礎上再次訓練得到一個模型(這個過程叫做Fine-tune),其效果在幾乎所有NLP任務上都明顯優於當時最好的模型。

這個方法叫做預訓練(Pre-training),它給伊人久久大香线蕉综合的最大啟示在於不同的機器學習任務其底層有相通之處,伊人久久大香线蕉综合可以用大量任務無關的數據(大數據)事先訓練好一個模型,等到要解決特定任務時,隻需要用少量任務相關的數據(小數據)對模型進行微調,即可達到理想的效果。這種方法對訓練數據量的要求更少,數據標注成本更低,訓練時間也更快,最為關鍵的是,在預訓練基礎上訓練的模型比沒有預訓練的模型效果要好。

回到RPA+AI場景,前麵提到的OCR任務雖然使用不同的模型,其底層確有相通之處。比如,雖然針對不同類型文檔有不同的OCR模型,但伊人久久大香线蕉综合都可以將其拆分為其字符檢測和字符識別兩部分。因此,伊人久久大香线蕉综合可以通過大量數據預訓練得到檢測和識別的基礎模型,然後在特定任務上進行Fine-tune,這樣便能在保障模型效果的前提下,大大減少對訓練數據的要求,並降低了模型的訓練成本。

對於NLP任務,預訓練同樣能給伊人久久大香线蕉综合帶來明顯的收益。前麵提到的BERT,屬於預訓練的語言模型,除此之外,伊人久久大香线蕉综合還可以對詞的表示、句子的表示、篇章的表示等模型進行預訓練。

未來展望

UiBot Mage通過提供開箱即用的模型、預訓練等手段來加速RPA+AI的落地,但RPA+AI今天仍然在發展早期,未來還有很長的路要走。對於RPA+AI的未來發展,以下幾個方向值得伊人久久大香线蕉综合持續關注和不斷創新。

前麵提到,基於深度學習的AI模型對於硬件有較高的要求,其部署過程也比RPA要複雜很多,這無疑增加了RPA+AI的落地門檻。未來,軟硬件一體的RPA+AI產品或許能夠有效解決這一問題,用戶不用擔心硬件的選型、部署和維護,讓RPA+AI真正做到“開箱即用”。

此外,邊緣計算能力的提升和普及,使得AI的推理可以從服務端轉移到客戶端。由於RPA是運行在客戶端的軟件,相比基於服務端的RPA+AI方案,基於邊緣計算的RPA+AI方案在架構上更加簡單、靈活,其成本也將大幅下降。邊緣計算的RPA+AI方案將讓伊人久久大香线蕉综合真正實現“人人都有一個機器人”。

最後,一個好的AI係統需要“活”的數據來持續更新模型適應環境變化。因此,在RPA+AI中如何高效的實現人機協同,形成數據閉環,是一個未來值得研究的重要課題。