护士在办公室里被躁中文字幕,初尝人妻滑进去了莹莹视频,无码人妻一区二区三区线,色妞www精品视频在线观看,大战刚结婚的少妇

大模型查找文本相似性系統開發

有一個產品明細表,數據10萬條,帶價格,現在有一個1000條產品的表格,需要到10萬條數據里面找最相似的,并將價格列出來,同一產品名稱不同,比如數據庫里有大竹桿,大掃把,竹掃把1.9米,大掃帚等,我們查的產品可能是芨芨草掃把,需要從里面找到最相似的,我們現在的做法是系統一個字符一個字符去比對,找到比對上最多的,列出來,人工判定,今天通過大模型比對了一些案例,感覺效果很好,

主要體現在:一、分詞很好,能找出一條數據里面的關鍵詞,能識別規格型號,材質、工藝、品牌等等,都能識別出來;

二、有邏輯,比如,燒杯有50ml、100ml、500ml,能找到最接近的;

三、能根據邏輯判斷哪個最相似,

如,玻璃燒杯/100ml?高型燒杯|50ml?高型燒杯|3000ml,這三個最接近的是哪兩個,大模型給出的回答是:我們可以設定一個簡單的評分系統,其中每個匹配的特征得到一定的分數,不匹配的特征得0分。假設滿分為3分(每項1分),

我們可以這樣計算:1.關鍵名詞:燒杯與高型燒杯在功能上相似,但高型燒杯更具體,考慮到這一點,我們可以給“燒杯”與“高型燒杯”之間相似度評分為0.5分(因為高型燒杯是燒杯的一種,但不是所有燒杯都是高型的)。

2.3.材質:“玻璃”在第一個描述中出現,而在后兩個描述中未提及。但由于燒杯通常默認為玻璃材質,我們可以假設相似度為1分,除非有相反的證據。

4.5.規格尺寸:容量不同,這意味著在這一項上沒有相似性,得分為0分。

6.基于以上,我們可以計算兩兩之間的相似度得分:?玻璃燒杯/100ml 與 高型燒杯|50ml?o名稱相似度 = 0.5分o材質相似度 = 1分o規格尺寸相似度 = 0分o總相似度 = 1.5分?玻璃燒杯/100ml 與 高型燒杯|3000ml?o名稱相似度 = 0.5分o材質相似度 = 1分o規格尺寸相似度 = 0分o總相似度 = 1.5分?高型燒杯|50ml 與 高型燒杯|3000ml?o名稱相似度 = 1分(因為兩者都是高型燒杯)o材質相似度 = 1分(假設兩者都是玻璃材質)o規格尺寸相似度 = 0分o總相似度 = 2分如果將總分3分視為完全相同,那么可以認為:?“玻璃燒杯/100ml”與另外兩種燒杯的相似度為50%(1.5/3)。?“高型燒杯|50ml”與“高型燒杯|3000ml”的相似度為66.67%(2/3)。

但是,大模型只能一個一個去問,如果我有一個數據庫,存了10萬條數據,現在有1000條數據去一條一條找10萬條數據里面最相似的,用什么樣的方法更好呢?

假設我們現在有”關鍵名詞、型號、尺寸及規格、材質、工藝、重量、標準號、外觀顏色、包裝、其他技術要求”這些屬性,我們對10萬條基礎數據進行處理,讓大模型先分詞,然后導出存到本地查詢數據庫里,若每次查詢的時候就先導入大模型,分詞完以后,到本地查詢數據庫,用常規模糊查詢,但是,這里面有個特別關鍵的問題,外面的系統查詢能不能做的更像大模型,比如,導出一個燒杯75ml,分詞以后,燒杯,75ml,但是系統只有50ml和100ml的,還有其他的250ml的,等等,能不能導出最接近的價格略高的那個尺寸,如這幾個里面最優解就是100ml,這種怎么實現,這種例子很多,再比如,系統存了單位是公斤,如果大模型,天然的知道和kg是一個東西,然而,導出以后,沒有大模型的幫助,這些都很難判斷,類似的例子太多了。

誰有更好的辦法解決這個問題,可以聯系我,價格面議。

途傲科技為中小企業提供網站制作、網站建設、微信H5、微信小程序,多商戶平臺,多級分銷系統,APP開發,手機網站,HTML5多端自適應網站,營銷型企業站建設,及對技術人才的培養等都積累與沉淀了豐富的心得和實戰經驗。

如果您想定制同款軟件,可以將需求提交給我們【免費提交需求,獲取解決方案】

免責聲明:文章部分內容收集于互聯網,不代表本站的觀點和立場,如有侵權請聯系刪除。

在線客服
途傲科技
快速發布需求,坐等商家報價
2025-08-06 02:12:24
您好!歡迎來到途傲科技。我們為企業提供數字化轉型方案,可提供軟件定制開發、APP開發(Android/iOS/HarmonyOS)、微信相關開發、ERP/OA/CRM開發、數字孿生BIM/GIS開發等。為了節省您的時間,您可以留下姓名,手機號(或微信號),產品經理稍后聯系您,免費幫您出方案和預算! 全國咨詢專線:18678836968(同微信號)。
您的留言我們已經收到,現在添加運營微信,我們將會盡快跟您聯系!
[運營電話]
 18678836968
取消

選擇聊天工具: