https://glase.org/interviews/how-can-crop-production-data-advance-the-control-environment-agriculture-industry/
環控農業開放數據此計畫項目目的在於通過收集和傳播農作物生產數據,來推進環控研究,機器學習和人工智慧。
David Kuack
在環控作物生產方面,私營公司和大學研究人員都產生了大量數據。現在正在為觀賞植物,糧食作物和大麻生成長產生此數據。關於所有這些數據的問題之一,這些數據是否能夠最大程度地利用它來使園藝業受益。
溫室照明和系統工程(the
Controlled Environment Agriculture Open Data, GLASE)聯盟的執行董事(executive
director of the Greenhouse Lighting and Systems Engineering) Erico Mattos 說:“數據已成為大學研究人員和私人公司在園藝行業中的一個重要話題。 人們可以根據正在產成的數據數量來識別挑戰和機遇。但是我們還沒有集中的存儲庫和標準的存儲方法來允許我們探索和利用這些數據。”
環控農業開放數據(the
Controlled Environment Agriculture Open Data, CEAOD)項目的形成目的在於促進大學和私人公司之間的作物生產數據彼此共享,以加速CEA研究。
解決數據擴散問題
在2018年the
North Central Extension & Research Activity–101, NCERA-101)會議期間,由美國農業部組織的委員會成員討論如何處理環控研究人員產生的大量數據。俄亥俄州立大學教授Chieri Kubota建議成立一個小組委員會,以解決為了共享由環控農業研究人員生成的數據而制定準則的需求。
Kubota發起關於是否需要一個集中的平台,從環控研究收集存儲數據的討論。 Mattos說“成立了一個工作隊,其中包括Chieri ,USDA-ARS的Kale Harbick ,普渡大學教授Yang Yang ,Plenty的Melanie Yelton 和我本人。自管委會成立以來,Koidra的Ken
Tran 和康奈爾大學的Timothy Shelford 均已加入會員。
“我們開始討論如何利用所有這些數據。美國的研究人員收集了大量數據。收集了環控研究中的所有環境數據,例如溫度,相對濕度,二氧化碳和光照水準。還有一組生物學數據,包括植物生物量和果實產量。私人公司還產生和收集了大量與園藝產業不共享的研究數據。隨著感測器和環境控制技術的進步,現在可以收集這些數據。隨著計算能力的提高,這些數據可用於啟動以前沒有的新應用程序和新的工具。但是,我們必須存取大量數據。這就是為什麼工作小組認為最好創建一個存儲庫。研究人員和私人公司可以按照特定格式共享數據。然後可以將這些數據用於機器學習和人工智慧應用的發展,以最佳化商業CEA操作中的農作物產量。”
包括USDA在內的越來越多的資助機構和組織,要求研究人員在其資助計劃中從事有關其數據管理計劃的消息。
收集和組織數據的需求
Mattos 說大學研究人員看到了創建集中式數據庫的價值。考慮到美國有多少研究人員,可能有數百萬個大數據點。從歷史上看,這些研究人員不需要共享他們的數據。但是包括USDA在內,越來越多的資助機構和組織要求研究人員共享其數據。如果研究人員向USDA申請資助,則必須在其申請資助中提供有關其數據管理計劃。
研究人員看到了共享這些數據的價值,但是這還不是分配時間和資源的普遍做法。這代表著研究團隊中每個人必須組織和共享數據。
創建中央數據庫
基於收集和組織正在生成的環控研究數據的需要,工作隊建立了環控農業開放數據(Controlled
Environment Agriculture Open Data (CEAOD) project)項目。該項目目的在促進數據共享以加速CEA研究。
CEAOD網站提供有關如何上傳數據的指南。工作隊制定了指南,其中包括三套可以上傳到網站的數據。一組是環境數據,包括環境控制參數,例如溫度,二氧化碳,相對濕度和通風。這些數據點通常由感測器自動收集。另一組數據是生物學數據,通常是人為收集的。這些生物性生產產量參數包括枝條生物量,根生物量,以及植物高度和重量。最終數據是文字檔,它是實驗設置和數據集的描述。它是解釋實驗的文件。它描述了如何完成實驗。
建議採用某種格式將數據上傳到CEAOD網站。網站上列出了步驟過程。對於可以提交數據的作物沒有任何限制。目標是建立一個平台,以管理大量農作物生產數據集,以便開發提高農作物生產效率的機器學習和人工智慧算法。
以實例加以引導
今年冬季,GLASE將有一名學生收集和整理環境和生物學研究數據。Mattos 說“數據將被上傳到CEAOD數據庫,我們將記錄這些活動。我們將創建建議指南。我們還計劃與其他機構的研究人員合作,展示如何組織和上傳數據以提高希望以及如何使用數據庫。我們希望最初的GLASE貢獻能激勵其他研究人員分享他們的數據,並有助於上傳數據過程。免費訪問CEAOD數據庫。它是一個開放的平台,任何人都可以為該數據庫工具的開發做出貢獻。”
一旦收集了研究數據並可供分發使用,用於生產環控作物的設備將能夠最佳化各種作物的環境條件。
對園藝業的好處
Mattos 說,私人公司也將從數據收集和創建集中式數據庫中受益。這些公司需要更多數據,因為這將使他們能夠分析數據,以開發新產品並確定新市場。不幸的是,許多公司不想共享他們的數據。他們對數據非常專有。他們看到收集和分析這些數據可以使它們在競爭中處於領先地位。許多私人公司都看到了更多數據的需求,以及如何獲得有價值的數據,但不願共享自己的數據。但是像其他行業一樣,也有早期採用者。我相信將會有更多的公司加入進來,並與園藝業分享他們的數據。希望產業界人士也願意為此數據庫做出貢獻。
Mattos 表示,該項目的一項重大應用與機器學習和人工智慧有關。在這些應用程序中,需要大量數據才能創建基準。使用數據可以教導機器。當前種植者的生產知識和見解比人工智慧預測更準確。種植者仍然更加可靠,但是使用大數據只是時間問題,人工智慧將能夠使種植者與之匹配,從而最佳化增長。我們正在嘗試在種植者和環控研究人員與機器學習/數據計算機科學家之間,開發這個平台。我不確定環控研究人員是否掌握了可用的潛力。我們沒有使用這項技術。建立這個平台,當我們收集和傳播數據時,就有真正的潛力來幫助園藝業的發展。”
更多信息:Erico Mattos ,溫室照明和系統工程(GLASE),(302)290-1560;em796@cornell.edu。
David Kuack 是德克薩斯州沃思堡的自由技術作家。dkuack@gmail.com。
|