精品人妻无码一区二区三区软件 ,麻豆亚洲AV成人无码久久精品,成人欧美一区二区三区视频,免费av毛片不卡无码

您現(xiàn)在的位置是:首頁(yè)經(jīng)濟(jì)科學(xué)論文

農(nóng)業(yè)經(jīng)濟(jì)論文農(nóng)資產(chǎn)品個(gè)性化推薦的研究

發(fā)布時(shí)間:2014-04-21 09:47:23更新時(shí)間:2014-04-21 09:47:46 1

  現(xiàn)如今在茫茫如海的網(wǎng)絡(luò)信息中去尋找對(duì)自己有用的信息已經(jīng)越來(lái)越難,為此個(gè)性化推薦技術(shù)應(yīng)運(yùn)而生,它能夠針對(duì)每一位用戶提供專屬于他自己的推薦信息,尤其是在商業(yè)上應(yīng)用廣泛,時(shí)至今日幾乎所有大型的電子商務(wù)網(wǎng)站,如亞馬遜、京東商城和當(dāng)當(dāng)網(wǎng)等,都推出了個(gè)性化推薦服務(wù)[1],他們往往通過(guò)用戶的注冊(cè)信息、瀏覽記錄和消費(fèi)記錄對(duì)每位用戶進(jìn)行個(gè)性化推薦[2,3]。

  【摘要】文章首先介紹了農(nóng)資產(chǎn)品個(gè)性化推薦的背景和意義,然后介紹關(guān)于農(nóng)資產(chǎn)品進(jìn)行個(gè)性化推薦的技術(shù),如粗糙集技術(shù)和ROCK聚類算法等,再然后對(duì)農(nóng)資產(chǎn)品個(gè)性化推薦系統(tǒng)進(jìn)行詳細(xì)的描述,最后對(duì)不足進(jìn)行了總結(jié)。

  【關(guān)鍵詞】個(gè)性化推薦,商品關(guān)鍵屬性,ROCK聚類算法,粗糙集

  1.背景

  針對(duì)農(nóng)村市場(chǎng)的電子商務(wù)網(wǎng)站現(xiàn)在還不多,對(duì)農(nóng)村用戶的個(gè)性化推薦更是寥寥無(wú)幾,中國(guó)到目前為止還是一個(gè)農(nóng)業(yè)大國(guó),農(nóng)村市場(chǎng)有著無(wú)限的潛力可以挖掘,縱然消費(fèi)能力弱和物流條件差等可能是阻礙這一進(jìn)程的原因,但是隨著國(guó)家對(duì)鄉(xiāng)鎮(zhèn)農(nóng)業(yè)的持續(xù)大力支持,農(nóng)業(yè)信息化的前景將更加廣闊,而針對(duì)農(nóng)村市場(chǎng)建立相應(yīng)的電子商務(wù)網(wǎng)站并對(duì)農(nóng)村用戶進(jìn)行個(gè)性化推薦勢(shì)必也將提上日程。農(nóng)資信息網(wǎng)通過(guò)傳播農(nóng)業(yè)技術(shù)知識(shí)、宣傳農(nóng)業(yè)政策法規(guī)和提供農(nóng)資產(chǎn)品的電子商務(wù)平臺(tái)等服務(wù)將成為服務(wù)農(nóng)民、開拓農(nóng)村市場(chǎng)的先行者[4]。在網(wǎng)站建設(shè)中如果將針對(duì)農(nóng)村群體的個(gè)性化推薦技術(shù)加入其中,那么網(wǎng)站將會(huì)為那些知識(shí)較缺乏、信息較閉塞的廣大農(nóng)村用戶提供更貼切、更周到的服務(wù),將更符合用戶需求的信息和產(chǎn)品推薦給他們。

  農(nóng)村市場(chǎng)的農(nóng)資用戶與普通的電子商務(wù)網(wǎng)站用戶在推薦模式上有著很大的區(qū)別。首先,普通的電子商務(wù)網(wǎng)站用戶是依照自己的興趣愛(ài)好、生活習(xí)慣和需求去瀏覽網(wǎng)頁(yè)并進(jìn)行購(gòu)物,所以針對(duì)他們的個(gè)性化推薦往往以興趣愛(ài)好作為首要因素;然而,對(duì)于農(nóng)資用戶而言,興趣愛(ài)好并不是左右他們購(gòu)買商品的原因,能否滿足他們的需求,也就是說(shuō)東西好不好、實(shí)不實(shí)用才是影響其個(gè)性化推薦的主因,因此銷售后的回訪、評(píng)價(jià)往往對(duì)日后的推薦影響重大,然而由于農(nóng)資產(chǎn)品的特色性質(zhì),它的驗(yàn)證期往往很長(zhǎng),少則三個(gè)月多則一年,因此針對(duì)農(nóng)資用戶建立推薦模型則需要時(shí)以年計(jì)的數(shù)據(jù)庫(kù)為依托,不可能迅速投入商業(yè)應(yīng)用,所以應(yīng)該利用線下銷售中得到的大量不完備信息進(jìn)行整理,找到影響推薦的關(guān)鍵信息,才能使網(wǎng)站推薦系統(tǒng)投入商用[5]。第二,商品對(duì)用戶的吸引力往往不在于其本身所有的屬性,而在于該商品包含了某種或多種關(guān)鍵屬性,是這些關(guān)鍵屬性讓用戶了那些商品,所有我們將運(yùn)用粗糙集技術(shù)去處理那些大量的不完備信息并簡(jiǎn)約出商品的關(guān)鍵屬性。第三,由農(nóng)民朋友日常的消費(fèi)習(xí)慣得知,他們購(gòu)買的農(nóng)資產(chǎn)品時(shí)往往會(huì)借鑒周圍朋友的購(gòu)買經(jīng)驗(yàn),也就是說(shuō)相同人群的人購(gòu)買的商品也大致相同,所以ROCK聚類算法在這方面能夠提供很好的幫助,因?yàn)镽OCK算法提出了鄰居概念,即:如果兩個(gè)消費(fèi)者不僅它們本身相似,而且它們的鄰居也相似,則這兩個(gè)消費(fèi)者很可能屬于同一個(gè)簇。

  本文針對(duì)農(nóng)資產(chǎn)品個(gè)性化推薦的特殊性建立了個(gè)性化推薦系統(tǒng)模型。

  2.ROCK算法

  ROCK(RobustClusteringUsingLinks)算法是一種凝聚的層次聚類算法,是由Guha等人在1999年提出的,適用于類別屬性[6]。

  對(duì)于具有分類屬性的數(shù)據(jù),傳統(tǒng)的聚類算法一般采用距離函數(shù)來(lái)度量數(shù)據(jù)對(duì)象間的相異度。然而,實(shí)驗(yàn)表明這種距離度量方法對(duì)具有分類屬性的數(shù)據(jù)不能得到好的聚類結(jié)果。而且絕大多數(shù)聚類算法只考慮點(diǎn)與點(diǎn)之間的相似性,因此在聚類的每一步,具有最大相似度的點(diǎn)被合并到同一個(gè)簇中這樣很容易導(dǎo)致錯(cuò)誤的合并。例如,有幾個(gè)點(diǎn)來(lái)自兩個(gè)顯著不同的簇,而這幾個(gè)點(diǎn)非常接近,那么根據(jù)上述的點(diǎn)與點(diǎn)之間的相似度,這兩個(gè)顯著不同的簇將被錯(cuò)誤地合并在一起。為了避免這種情況,ROCK采取了更加周全的方法,也即引入了鄰居的概念。如果兩個(gè)點(diǎn)不僅它們本身相似,而且它們的鄰居也相似,則這兩個(gè)點(diǎn)可能屬于同一個(gè)簇,因此被合并。

  【定義1】鄰居:兩個(gè)點(diǎn)Pi,Pj,如果滿足sim(Pi,Pj)≥A,則稱Pi,Pj為鄰居。其中,sim是一個(gè)相似性度量函數(shù),A是由用戶給定的閾值。sim可以是一個(gè)距離度量或者甚至是由領(lǐng)域?qū)<姨峁┑姆切问交亩攘浚灰軌驑?biāo)準(zhǔn)化為0和1之間的值,而且這種值越大,相應(yīng)的兩點(diǎn)間的相似度越高。

  【定義2】連接:link(Pi,Pj)為二數(shù)據(jù)點(diǎn)Pi,Pj的相同鄰居數(shù),值愈大表Pi,Pj同一簇的幾率愈大。

  【定義3】標(biāo)準(zhǔn)函數(shù):

  在聚類過(guò)程中,我們需要最大化簇內(nèi)link(pq,pr)數(shù)量的同時(shí)最小化簇間link(pq,pr)的數(shù)量。此式子能夠幫助我們找到簇內(nèi)最多鏈接的同時(shí)盡量減少簇間鏈接數(shù)。其中:

  ni為簇Ci中數(shù)據(jù)點(diǎn)的總數(shù);

  為Ci中預(yù)期的鄰居總數(shù);

  為Ci中預(yù)期鏈接總數(shù)。

  是根據(jù)數(shù)據(jù)集設(shè)定的一個(gè)函數(shù)

  【定義4】?jī)?yōu)化函數(shù):

  此優(yōu)化函數(shù)用于合并相似簇,而且能夠有效避免出現(xiàn)離群數(shù)據(jù)點(diǎn)時(shí)將所有簇都合并為一個(gè)簇。

  其中為二簇中預(yù)期交叉鏈接個(gè)數(shù)。

  ROCK算法流程如下:

  1)輸入?yún)?shù):包含n個(gè)數(shù)據(jù)點(diǎn)的集合S,及預(yù)期簇?cái)?shù)k;

  2)最初階段,每一數(shù)據(jù)點(diǎn)為一簇;

  3)計(jì)算各點(diǎn)的鏈接數(shù);

  4)為每一個(gè)簇i,建立一個(gè)區(qū)域堆q[i],包含每一個(gè)與簇i的鏈接數(shù)不為零的簇j;

  5)q[i]中的各簇j依g(i,j)值由大至小排序;

  6)建立一全局堆(globalheap)Q,包含每一q[i]的優(yōu)化函數(shù)最大值的簇j;

  7)每一回合,合并Q中最佳簇j與q[j]中的最佳簇;

  8)合并的同時(shí)重新運(yùn)算各區(qū)域堆及全域堆,包括新形成的簇;9)當(dāng)簇?cái)?shù)不小于k時(shí),持續(xù)合并,此外當(dāng)所有q[i]=0時(shí)停止合并。

  3.粗糙集

  粗糙集理論是一種不精確、不確定性知識(shí)的數(shù)學(xué)工具,由波蘭科學(xué)家Z.Pawlak提出,一經(jīng)提出便引起了廣泛的討論[7]。粗糙集的知識(shí)形成思想可以概括為:一種類別對(duì)應(yīng)于一個(gè)概念(類別一般表示為外延即集合,而概念常以如規(guī)則描述這樣的內(nèi)涵形式表示),知識(shí)由概念組成;如果某知識(shí)中含有不精確概念,則該知識(shí)不精確。粗糙集對(duì)不精確概念的描述方法是通過(guò)下近似(LowerApproximation)和上近似(UpperApproximation)概念來(lái)表示。一個(gè)概念的下近似概念中的元素肯定屬于改概念,而一個(gè)概念的上近似概念只可能屬于該概念。

  粗糙集把客觀世界抽象為一個(gè)信息系統(tǒng)。一個(gè)信息系統(tǒng)S是一個(gè)四元組,S=:

  U是對(duì)象的有限集合,記為U={X1,X2,….Xn};A是屬性的有限集合,記為A={A1,A2,…An};V是屬性的值域集合,記為V={V1,V2…Vn};其中Vi是屬性Ai的值域;F是信息函數(shù),即,f:U*A->,f(Xi,Aj)屬于Vj;屬性集A由集合C和集合D組成,其中C為條件屬性集合,D為決策屬性集合,兩者無(wú)交集。對(duì)于屬性集A中任意一個(gè)屬性a,通過(guò)f(Xi,a)函數(shù)時(shí),如果某兩條記錄對(duì)于屬性a取值相同,我們則稱此兩個(gè)記錄基于屬性集等價(jià),所有基于某個(gè)屬性集等價(jià)的記錄被定義為等價(jià)類。

  粗糙集的近似空間(ApproximationSpa-ce)。近似空間有一個(gè)二元組,其中U為對(duì)象的有限集合,B為A的一個(gè)子集,R(B)={(x1,x2)|f(x1,b)=f(x2,b)}。則對(duì)于任意一個(gè)概念O。

  設(shè)屬性集B1是B2的真子集,如果R(B1)=R(B2),則稱B2可歸約于B1,如果B1不可進(jìn)一步歸約,則稱B1為U的一個(gè)歸約子。

  設(shè)屬性集P和Q,則P對(duì)Q的屬性依賴度為:

  表示集合X在屬性集上的下近似。

  設(shè)屬性集BC,C是條件屬性集,D是決策屬性集,則屬性重要度(Attributessi-gnificance)定義為:

  4.屬性簡(jiǎn)約和聚類

  4.1當(dāng)前農(nóng)資電子商務(wù)網(wǎng)站的推薦模式

  當(dāng)前中國(guó)國(guó)內(nèi)關(guān)于農(nóng)產(chǎn)品的電子商務(wù)網(wǎng)站還不是太多,專門針對(duì)農(nóng)資產(chǎn)品的電子商務(wù)網(wǎng)站更是鳳毛麟角,這些已有的農(nóng)資電子商務(wù)網(wǎng)站中應(yīng)用的產(chǎn)品推薦系統(tǒng)還不是太成熟,其主要的推薦方式如下:

  1)最新產(chǎn)品推薦及熱銷產(chǎn)品推薦

  這種方式多應(yīng)用于小型電子商務(wù)網(wǎng)站或網(wǎng)站的運(yùn)營(yíng)初期,某些網(wǎng)站也會(huì)在節(jié)假日促銷時(shí)使用這種推薦方式;這是一種形式簡(jiǎn)單但是效果尚佳的推薦方式,滿足了用戶求優(yōu)、求新和求性價(jià)比的心理訴求,其缺點(diǎn)是不能對(duì)客戶進(jìn)行深度挖掘,沒(méi)有針對(duì)性,容易掩蓋具有高價(jià)值量的客戶需求。

  2)評(píng)價(jià)式推薦

  通過(guò)對(duì)產(chǎn)品的售后評(píng)價(jià),對(duì)同類產(chǎn)品進(jìn)行好評(píng)排序,將好評(píng)度最高的商品推薦給用戶。這種推薦方式也較多用于小型電子商務(wù)網(wǎng)站或B-C商家的網(wǎng)店中,能較好的為那些對(duì)某一種或某幾種商品有需求的用戶提供幫助,服務(wù)范圍較窄而推薦作用強(qiáng)大。這兩種推薦方式還停留在全體推薦的層次上,沒(méi)有針對(duì)個(gè)人的推薦。

  4.2關(guān)于農(nóng)資產(chǎn)品的個(gè)性化推薦模型

  本推薦模型針對(duì)現(xiàn)有農(nóng)資推薦系統(tǒng)的問(wèn)題,運(yùn)用粗糙集技術(shù)遴選出商品的關(guān)鍵屬性,并通過(guò)ROCK聚類算法對(duì)用戶進(jìn)行聚類,從而針對(duì)每個(gè)用戶個(gè)人進(jìn)行推薦,更有針對(duì)性且效果更好。

  該推薦系統(tǒng)的流程如下:

  1)將搜集好的線下農(nóng)資產(chǎn)品銷售記錄進(jìn)行簡(jiǎn)單簡(jiǎn)約(由于是線下交易數(shù)據(jù)大多數(shù)為不完備數(shù)據(jù)),然后遴選出關(guān)鍵屬性;

  2)對(duì)線下銷售記錄中包含任一關(guān)鍵屬性的用戶提取出來(lái),運(yùn)用ROCK聚類算法找到對(duì)不同屬性感興趣的不同用戶簇;

  3)當(dāng)出現(xiàn)新用戶時(shí),判定新用戶的屬于哪一個(gè)用戶簇,將該用戶簇內(nèi)用戶感興趣的商品推薦給新用戶。

  4.2.1基于粗糙集的商品屬性簡(jiǎn)約

  表1是與線下交易信息匹配的決策信息表,其中有些信息是不完備的,而不完備的信息中也可能包含關(guān)鍵屬性,所以我們通過(guò)粗糙集技術(shù)對(duì)其進(jìn)行簡(jiǎn)約,從而找到影響用戶購(gòu)買的關(guān)鍵屬性[8、9]。我們將商品類別作為決策屬性,將價(jià)格和商家品牌等屬性作為條件屬性,如表1所示。

  僅以上圖屬性已知部分為數(shù)據(jù)庫(kù),建立實(shí)例如下:

  U={1,2,3,4,5,6,7};

  A={Cotton,Corn,Wheat};

  V={High,Medium,Low,Yes,No};

  f(1,category)=wheat;f(1,price)=medium;…。

  按條件屬性進(jìn)行分類,如E1={1,6};按決策屬性進(jìn)行分類,如Y1={1,6}。

  則在R中的兩個(gè)劃分為E和Y,E作為分類條件,Y作為分類決策,據(jù)此可進(jìn)行規(guī)則描述,如規(guī)則R(1,1)可表示為:Des(E1)—>Des(Y1)。其置信度為cf=1.則說(shuō)明當(dāng)price=medium,brand=no為購(gòu)買wheat產(chǎn)品的置信度為1,即price=medium,brand=no為wheat產(chǎn)品的關(guān)鍵屬性。實(shí)例演示完畢。

  由以上實(shí)例得知,在通過(guò)粗糙集進(jìn)行屬性簡(jiǎn)約的過(guò)程中,需要提前確定置信度閾值,由于數(shù)據(jù)量的問(wèn)題,本文沒(méi)有涉及屬性之間相關(guān)度的研究。

  通過(guò)粗糙集技術(shù)進(jìn)行簡(jiǎn)約,得到不同用戶所對(duì)應(yīng)的關(guān)鍵屬性類型如下:

  (用戶1:商品類別,廠家),(用戶2:商品類別,無(wú)),(用戶3:商品類別,價(jià)格,…)等等。

  4.2.2運(yùn)用ROCK算法進(jìn)行聚類

  聚類流程如下:1)根據(jù)上文得到的用戶數(shù)據(jù)集,將每個(gè)用戶都作為一個(gè)獨(dú)立的數(shù)據(jù)點(diǎn);

  2)利用相似度計(jì)算公式,計(jì)算任意兩個(gè)數(shù)據(jù)點(diǎn)之間的相似度,從而確定任意一個(gè)點(diǎn)的鄰居個(gè)數(shù);

  3)利用定義2確定任意兩個(gè)數(shù)據(jù)點(diǎn)之間的相同鄰居數(shù),即鏈接數(shù);

  4)為每一個(gè)簇建立一個(gè)區(qū)域堆q[i](初期時(shí),一個(gè)數(shù)據(jù)點(diǎn)記為一個(gè)簇),將與該數(shù)據(jù)點(diǎn)有相同鄰居的數(shù)據(jù)點(diǎn)按個(gè)數(shù)的多少加入該堆中,利用標(biāo)準(zhǔn)函數(shù)對(duì)堆內(nèi)的簇進(jìn)行歸并,從而形成大小不同的若干個(gè)區(qū)域堆[10];

  5)建立一個(gè)全局堆Q,按區(qū)域堆q[i]的大小排序加入到全局堆中,運(yùn)用優(yōu)化函數(shù)合并堆內(nèi)的相似簇;

  6)判斷全局堆Q中個(gè)數(shù)a,如果a5.結(jié)論

  由于該項(xiàng)目處于建站初期,在數(shù)據(jù)的采集和整理等方面的條件還不是很完善,尤其在許多專家知識(shí)的獲取上還不能很好地用計(jì)算機(jī)知識(shí)去表達(dá),致使實(shí)例的驗(yàn)證不是太完美,作者將會(huì)在日后逐步去改善。

  參考文獻(xiàn)

  [1]余力,劉魯.電子商務(wù)個(gè)性化推薦研究[J].計(jì)算機(jī)集成制造系統(tǒng),2004,10:1306-1313.

  [2]雷琨.電子商務(wù)個(gè)性化推薦系統(tǒng)研究[D].電子科技大學(xué),2012.

  [3]郭韋昱.基于用戶行為分析的個(gè)性化推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].南京大學(xué),2012.

  [4]王炬.農(nóng)業(yè)信息化進(jìn)程中的問(wèn)題及對(duì)策研究[D].西南農(nóng)業(yè)大學(xué),2003.


轉(zhuǎn)載請(qǐng)注明來(lái)自:http://www.jinnzone.com/jingjikexuelw/36094.html