本發(fā)明涉及一種基于rva大米中直鏈淀粉含量的快速檢測方法,屬于食品檢測。
背景技術(shù):
1、眾所周知,淀粉是大米的主要成分,分為直鏈淀粉和支鏈淀粉,其中,直鏈淀粉含量與大米的蒸煮特性、加工特性及米飯的粘性、硬度、凝聚性、膠黏性、回彈性等質(zhì)構(gòu)特性具有顯著的相關(guān)性,因此,直鏈淀粉含量是影響及評判大米品質(zhì)的重要關(guān)鍵指標(biāo),測定直鏈淀粉含量可以對大米的育種、加工、分類分級等提供重要參考價(jià)值。
2、目前測定直鏈淀粉含量的方法包括常規(guī)的化學(xué)檢測方法和基于近紅外光譜和可見光分析儀的檢測方法,其中,常規(guī)的化學(xué)檢測方法通常需要制粉、脫脂、試劑配制、標(biāo)曲制作、稱量、加熱、定容、顯色測定,測定要耗時(shí)1~2天,檢測程序十分繁瑣,顯著影響該指標(biāo)檢測的時(shí)效性;此外,受標(biāo)準(zhǔn)品精度及人工操作等影響,檢測精度也受到一定影響。而基于近紅外光譜和可見光分析儀的檢測方法,則需要對高維光譜數(shù)據(jù)進(jìn)行復(fù)雜的預(yù)處理,包括對波長的篩選,進(jìn)而根據(jù)所建立的近紅外光譜預(yù)測模型對直鏈淀粉含量進(jìn)行預(yù)測;高維光譜數(shù)據(jù)的預(yù)處理過程和波長的篩選都會(huì)對預(yù)測精度產(chǎn)生較大的影響,比如cn?114018859?a中公開的一種快速同步測定稻米粉表觀直鏈淀粉、直鏈淀粉和支鏈淀粉含量的方法中,其預(yù)測模型中包含了63個(gè)特征波長下的吸光度值,波長個(gè)數(shù)的選擇以及具體波長的選擇都會(huì)影響預(yù)測結(jié)果。
3、為了更加快速且準(zhǔn)確的實(shí)現(xiàn)大米直鏈淀粉含量的檢測,需要提出一種新的檢測方法。
技術(shù)實(shí)現(xiàn)思路
1、為了提供一種快速且準(zhǔn)確的大米直鏈淀粉含量檢測方法,本發(fā)明提供了一種基于rva大米中直鏈淀粉含量的快速檢測方法,所述方法包括:
2、步驟1,獲取待測大米的rva特征組合數(shù)據(jù),所述rva特征組合數(shù)據(jù)包括原始rva特征數(shù)據(jù)和新構(gòu)造rva特征數(shù)據(jù),所述新構(gòu)造rva特征數(shù)據(jù)包括溫度新特征、回生新特征、粘度新特征以及粘度-回生-時(shí)間新特征;
3、步驟2,基于所述rva特征組合數(shù)據(jù)采用機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)對于待測大米中直鏈淀粉含量的預(yù)測。
4、可選的,所述原始rva特征數(shù)據(jù)包括峰值粘度、最低粘度、崩解值和最終粘度;所述崩解值=峰值粘度-最低粘度。
5、可選的,所述溫度新特征定義如下:
6、
7、可選的,所述回生新特征包括:最終粘度/回生值、最低粘度/回生值和崩解值/回生值,所述回生值=最終粘度-最低粘度。
8、可選的,所述粘度新特征=峰值粘度-最終粘度。
9、可選的,所述粘度-回生-時(shí)間新特征為/峰值時(shí)間。
10、可選的,所述機(jī)器學(xué)習(xí)模型包括隨機(jī)森林模型、偏最小二乘回歸模型、貝葉斯回歸模型、梯度提升決策樹模型和輕量梯度提升機(jī)模型。
11、可選的,所述步驟2基于所述rva特征組合數(shù)據(jù)采用機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)對于待測大米中直鏈淀粉含量的預(yù)測包括:
12、步驟2.1,獲取機(jī)器學(xué)習(xí)模型訓(xùn)練集和測試集樣本數(shù)據(jù),所述訓(xùn)練集和測試集樣本數(shù)據(jù)為已知大米樣品對應(yīng)的rva特征組合數(shù)據(jù)和對應(yīng)的直鏈淀粉含量真值;
13、步驟2.2,基于訓(xùn)練集和測試集樣本數(shù)據(jù)對所采用機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練測試以確定模型最佳參數(shù);
14、步驟2.3,以步驟2.2確定的模型最佳參數(shù)對應(yīng)的機(jī)器學(xué)習(xí)模型作為大米直鏈淀粉含量預(yù)測模型;
15、步驟2.4,以待測大米對應(yīng)的rva特征組合數(shù)據(jù)作為輸入,采用步驟2.3得到大米直鏈淀粉含量預(yù)測模型實(shí)現(xiàn)對于待測大米中直鏈淀粉含量的預(yù)測。
16、可選的,所述機(jī)器學(xué)習(xí)模型為隨機(jī)森林模型,模型最佳參數(shù)取值:決策樹個(gè)數(shù)n_es=116、葉結(jié)點(diǎn)最少樣本數(shù)min_samples_leaf=1,內(nèi)部結(jié)點(diǎn)再劃分最小樣本數(shù)min_samples_split=2。
17、本申請還提供上述方法在谷物的直鏈淀粉含量檢測中的應(yīng)用。
1.一種基于rva大米中直鏈淀粉含量的快速檢測方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述原始rva特征數(shù)據(jù)包括峰值粘度、最低粘度、崩解值和最終粘度;所述崩解值=峰值粘度-最低粘度。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述溫度新特征定義如下:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述回生新特征包括:最終粘度/回生值、最低粘度/回生值和崩解值/回生值,所述回生值=最終粘度-最低粘度。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述粘度新特征=峰值粘度-最終粘度。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述粘度-回生-時(shí)間新特征為
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述機(jī)器學(xué)習(xí)模型包括隨機(jī)森林模型、偏最小二乘回歸模型、貝葉斯回歸模型、梯度提升決策樹模型和輕量梯度提升機(jī)模型。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟2基于所述rva特征組合數(shù)據(jù)采用機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)對于待測大米中直鏈淀粉含量的預(yù)測包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述機(jī)器學(xué)習(xí)模型為隨機(jī)森林模型,模型最佳參數(shù)取值:決策樹個(gè)數(shù)n_es=116、葉結(jié)點(diǎn)最少樣本數(shù)min_samples_leaf=1,內(nèi)部結(jié)點(diǎn)再劃分最小樣本數(shù)min_samples_split=2。
10.權(quán)利要求1-9任一所述的方法在谷物的直鏈淀粉含量檢測中的應(yīng)用。