基于多源异构数据融合的移动群智感知任务推荐算法-凯发国际一触即发

基于多源异构数据融合的移动群智感知任务推荐算法
task recommendation based on multi-source heterogeneous data fusion in mobile crowd sensing
doi: , , html, ,   
作者: 周易歆, 何杏宇, 李金慧:上海理工大学,出版印刷与艺术设计学院,上海
关键词: ;;;;;;;
摘要: 现有的移动群智感知任务推荐方法主要包括基于时空信息和社交关系两大类,分别受到时空信息时变性和数据稀疏性问题的限制。为了突破上述限制并综合多源工人行为数据对任务推荐准确度的影响,本文提出了一种基于多源异构数据融合的移动群智感知任务推荐算法。该算法综合考虑了工人地理位置、时间可用性以及社交网络关系等多方面的因素,利用隐语义模型、双向长短时记忆网络模型分别生成空间、时间维度的工人–任务匹配度矩阵实现对工人偏好时空变化的挖掘,并利用node2vec图嵌入模型生成社交维度的工人–任务匹配度矩阵,缓解数据稀疏性问题。最后利用bp神经网络将上述三个矩阵进行融合以实现工人行为的多源异构数据融合,并最终进行任务推荐。实验结果表明,本文方法比单一数据源的任务推荐方法具有更好的推荐准确度。
abstract: existing task recommendation methods for mobile crowd sensing primarily fall into two categories: those based on spatial-temporal information and those based on social relationships, both constrained by the variability of spatial-temporal information and data sparsity issues. to overcome these limitations and enhance task recommendation accuracy by integrating multi-source worker behavior data, this paper proposes a task recommendation method based on multi-source heterogeneous data fusion for mobile crowd sensing. the proposed method comprehensively considers multiple factors, including workers’ geographic locations, time availability, and social network relationships. it employs a latent semantic model and a bi-directional long short-term memory model to generate worker-task matching matrices in the spatial and temporal dimensions to capture temporal-spatial variations in worker preferences, while the node2vec graph embedding model generates the worker-task matching matrix in the social dimension to alleviate data sparsity issues. finally, a bp neural network is utilized to fuse these three matrices, achieving multi-source heterogeneous data fusion of worker behaviors and producing task recommendations. experimental results demonstrate that the proposed method achieves better recommendation accuracy than task recommendation methods based on a single data source of worker behaviors.
文章引用:周易歆, 何杏宇, 李金慧. 基于多源异构数据融合的移动群智感知任务推荐算法[j]. 运筹与模糊学, 2024, 14(5): 671-684.

1. 引言

移动群智感知(mobile crowd sensing, mcs)作为一种新兴的信息收集和处理方法[1],可以实现大规模数据收集。为了提高数据的质量和参与者的积极性,对参与者进行合理的任务推荐是重要的技术措施。现有的移动群智感知任务推荐方法的主要原理是从不同维度对工人行为数据进行分析,预测出工人的未来偏好并进行任务推荐,主要包括基于时空信息的任务推荐方法[2]与基于社交网络信息的任务推荐方法[3]。其中,基于时空信息的任务推荐方法主要是通过结合工人历史执行任务的记录中的时间与空间信息来更好地进行任务推荐[4],而基于社交网络信息的任务推荐方法则主要利用社交网络中的用户行为和关系信息来提高任务推荐的效果[5]。然而,第一类方法没有考虑到工人偏好的时变性,影响任务推荐的准确度。第二类方法的任务推荐精确性则受到社交网络数据稀疏性问题的限制。此外,现有任务推荐方法大多基于单一维度的工人行为数据分析进行任务推荐,如工人相似度、任务相似度、工人移动序列等维度,限制了推荐准确度的提高[6]。而基于多个维度的工人行为数据分析进行任务推荐存在异构数据融合的挑战。

为此,本文将提出一种基于多源异构数据融合的移动群智感知任务推荐方法,具体地,该方法首先定义时变性的工人–任务兴趣因子,基于此构造初始的时间维度工人–任务匹配度矩阵,并通过隐语义模型对初始的时间维度工人任务匹配度矩阵进行补全优化;接着通过双向长短期记忆网络预测工人的位置,并计算预测位置与任务位置的相似度以构造空间维度的工人–任务匹配度矩阵;然后根据工人社交信息生成社交网络图,使用node2vec图嵌入技术得到工人的社交维度特征向量,以计算工人之间的社交相似度来构造工人亲密度矩阵,并结合工人亲密度矩阵与工人的历史任务参与度计算社交维度的工人–任务匹配度矩阵;最后,使用bp神经网络将上述三个维度的工人–任务匹配度矩阵进行融合,得到最终的多维度工人–任务匹配度矩阵,并根据此实现任务推荐。

2. 相关工作

2.1. 基于时空信息的任务推荐方法

手机等移动定位设备的快速普及推动了时空众包技术的发展,各种基于空间位置的服务与人们的生活联系越来越密切。从工人的历史执行任务信息中提取时空信息进行任务推荐,能够有效提高任务推荐的准确率。文献[7]基于用户移动轨迹预测对用户进行任务推荐,通过递归神经网络预测用户下一目的地,并通过注意力机制捕获与候选任务相似的记录,获取任务选择偏好进行任务推荐。文献[8]通过构建时空知识图谱,利用transe模型进行知识图谱嵌入,使用图卷积神经网络和循环神经网络学习工人与任务的密集表示,结合时空信息与工人偏好进行任务推荐。文献[9]提出了一种基于指数分布的时长敏感任务推荐模型,通过构建效用函数,结合贪心算法,综合考虑工人的历史执行记录和任务时长进行任务推荐;文献[10]提出一种动态延迟决策任务推荐算法,通过移动预测方法计算用户在感知任务结束前到达目的地的概率,采用双深度q网络,优化使得平台利润最大化,工人移动距离与响应时间最小化来进行任务推荐。文献[11]通过考虑用户参与下一任务时的出行方式变化,构建变速多任务分配的约束多目标优化模型,通过最大化用户奖励和最小化任务完成时间来进行任务推荐。

然而,大多基于时空信息的任务推荐方法没有考虑到工人偏好的时空变化,影响任务推荐的准确度,因此,本文采取结合了兴趣因子的隐语义模型与双向长短时记忆网络模型来生成时间维度与空间维度的工人–任务匹配度矩阵,考虑工人历史行为的时序性,挖掘工人偏好的动态变化以进行任务推荐。

2.2. 基于社交网络信息的任务推荐方法

人的行为往往受到从众心理的影响,工人参与任务的意愿往往受到周围工人的影响。因此在任务推荐中利用社交网络来分析工人的影响力和工人之间的社交关系,据此提高任务推荐的精度[12]。文献[13]通过矩阵分解模型,引入工人在社交网络中的外向性与亲密度计算工人对任务的评分,生成每个工人的任务推荐列表;文献[14]在基于位置的社交网络中,结合用户偏好和社交影响力进行任务推荐。文献[15]通过构建社交网络,分析工人的社交关系信息,与工人的偏好信息相结合,为不活跃的工人进行任务推荐。文献[16]通过对工人偏好、历史记录与社交网络信息进行综合分析,为工人进行任务推荐。

但是,在实际任务推荐过程中考虑社交网络信息往往存在着数据稀疏性问题,导致任务推荐准确率较低。因此,本文通过构建社交网络图,使用node2vec图嵌入技术,学习工人的特征向量表示,计算工人之间的社交相似度来帮助生成社交维度工人-任务匹配度矩阵,在一定程度上缓解数据稀疏性问题,提高了任务推荐的准确率。

3. 模型与方案陈述

本文提出基于多源异构数据融合的移动群智感知任务推荐算法,算法的整体架构如图1所示,由时间维度工人行为分析模块、空间维度工人行为分析模块、社交维度工人行为分析模块和多维度工人行为分析融合模块共四个模块组成。分别为基于隐语义模型的时间维度工人–任务匹配度矩阵生成、基于bi-lstm模型的空间维度工人–任务匹配度矩阵生成、基于node2vec图嵌入技术的社交维度工人-任务匹配度矩阵生成与基于bp神经网络的多维度工人–任务匹配度矩阵生成。

3.1. 基于隐语义模型的时间维度工人–任务匹配度矩阵生成

在时间维度工人行为分析模块中,构造时间维度的工人–任务匹配度矩阵的算法流程图如图2所示,首先构造初始时间维度工人任务匹配度矩阵,然后利用隐语义模型对其进行迭代优化。

figure 1. task recommendation model structure diagram based on multi-source heterogeneous data fusion

1. 基于多源异构数据融合的任务推荐模型结构图

figure 2. algorithm flowchart for constructing worker-task matching matrix from temporal dimension

2. 构造时间维度的工人–任务匹配度矩阵的算法流程图

1) 构造初始时间维度工人任务匹配度矩阵 m time m ij time 为矩阵 m time 中第i行第j列的元素,表示工人i对任务j的时间维度匹配度,具体计算方法如公式(1)和(2)所示:

m ij time = l=1 k n ij ( l ) (1)

n ij ( l ) =exp( β| t ij ( l ) t rec | ) (2)

其中, n ij ( l ) 表示工人i对任务j的第l次参与时的兴趣因子,k为工人i对任务j的参与次数。兴趣因子 n ij 的计算使用指数衰减函数,其中 β 为兴趣衰减因子, t ij ( l ) 为工人il次参与任务j的时间, t rec 为进行推荐的时间。

2) 优化时间维度工人–任务匹配度矩阵 m time

在优化时间维度工人–任务匹配度矩阵的过程中,本文首先通过公式(3)将初始的时间维度工人–任务匹配度矩阵 m time 分解为工人隐含特征矩阵u和任务隐含特征矩阵v,然后分别对工人隐含特征矩阵u与任务隐含特征矩阵v之中的参数uv进行迭代优化,提取出最优的隐含特征矩阵uv,并据此计算得到最终的时间维度工人–任务匹配度矩阵 m time 。在矩阵分解过程中使用余弦相似度预测时间维度工人–任务匹配度。具体地,工人i与任务j的时间维度匹配度 m ij time ^ 计算方式如公式(4)所示。

m time =u×v (3)

m ij time ^ = u i v j u i v j (4)

其中 u i u的第i行,代表工人i的隐含特征向量, v j v的第j行,表示任务j的隐含特征向量。采用随机梯度下降法(sgd)计算迭代求解过程中的损失函数全局最小值,计算方法如公式(5)所示。为了避免过拟合现象,在损失函数的迭代优化过程中加入正则化因子。

min u,v = min u,v { i,j ( m ij time m ij time ^ ) 2 λ u i 2 λ v j 2 } (5)

其中, m ij time 为工人i与任务j的时间维度实际匹配度, m ij time ^ 为工人i与任务j的时间维度预测匹配度, λ 为防止过拟合的正则化参数。

3.2. 基于bi-lstm模型的空间维度工人–任务匹配度矩阵生成

在空间维度工人行为数据分析模块中,bi-lstm模型结构如图3所示,使用bi-lstm模型预测工人可能到达的下一个位置,基于预测的位置和各个任务的位置进行相似度计算,得到空间维度的工人–任务匹配度矩阵。

figure 3. the structure of bi-lstm model

3. bi-lstm模型结构图

1) 位置序列嵌入:在输入层输入每个工人的位置序列 l i =[ ( t 1 , l 1 ),( t 2 , l 2 ), ] ,其中l为工人it时刻所处的位置。在嵌入层通过word embedding技术对工人位置序列信息进行嵌入,得到序列嵌入向量 e i

2) bi-lstm:将通过嵌入层转化而得的嵌入向量序列 e i 输入到bi-lstm层,采用正向lstm为每个时间点生成隐藏状态 h t f ,采用反向lstm为每个时间点生成隐藏状态 h t b ,最后合并正反向lstm的输出得到 h t ,公式如(6)、(7)、(8)所示:

前向lstm为每个时间点生成隐藏状态:

h t f =lst m f ( e t , h t1 f ) (6)

后向lstm为每个时间点生成隐藏状态:

h t b =lst m b ( e t , h t1 b ) (7)

合并前向和后向lstm的输出:

h t =[ h t f , h t b ] (8)

其中, h t f 为前向lstm的输出, h t b 为后向lstm的输出, h t 为lstm层的输出。

3) 预测位置输出:在全连接层对工人i可能到达的下一个位置 l i 进行预测,公式如(9)所示:

l i =softmax( w l h t b l ) (9)

其中 w l 为权重矩阵, b l 为偏置项, l i 为工人i下一可能到达位置的位置id。

4)生成空间维度工人–任务匹配度矩阵 m space m ij space 为空间维度工人–任务匹配度矩阵 m space 中的元素,表示工人i和任务j的空间维度匹配度,公式如(10)所示:

m ij space =2rarcsin( sin 2 ( | la t i la t j | 2 ) cos( la t i )cos( la t j ) sin 2 ( | la n i la n j | 2 ) ) (10)

其中 ( la n i ,la t i ) 为对应的工人位置id信息得到的下一可能到达位置 l i 的经纬度,r为地球半径。

3.3. 基于node2vec图嵌入技术的社交维度工人-任务匹配度矩阵生成

3.3.1. 基于node2vec图嵌入提取工人社交维度特征向量

在社交维度工人行为数据分析模块中,首先,根据工人社交信息生成工人社交网络图graph g,使用node2vec图嵌入技术学习工人特征向量,具体算法过程如表1所示。

1) learnfeatures( graph g=( v,e,w ) ) 函数:用于提取图特征,其中 graphg 表示社交网络图,v为节点,表示工人;e为边,表示二者有朋友关系,w为权重,设为1。

2) π=preprocessmodifiedweights( g,p,q ) 函数:用于生成随机游走采样策略,其中g为社交网络图, p,q 为超参数。每个节点生成r个随机游走序列,对于图中的每个节点,生成一个随机游走序列 walk

3) walk=node2vecwalk( g ,u,l ) 函数:用于生成随机游走序列 walk ,其中 g 为经过权重调整后的新社交网络图,l为随机游走序列个数。初始化 walk 为包含起始节点 u 的序列。对于每个游走迭代步骤,从当前节点开始,向邻居节点进行随机游走。调用 getneighbors( curr, g ) 函数,获取当前节点的邻居节点,其中 curr 为当前节点, v curr 为当前节点的邻居节点。根据采样策略 aliassample ,选择下一个节点 u i 。将节点 u i 添加到游走序列 walk 中,并返回随机游走序列 walk

4) f( u )=stochasticgradientdescent( k,d,walks ) 函数:用于基于skip-gram模型训练生成工人节点u的特征向量。

table 1. node2vec graph embedding technique algorithm

1. node2vec图嵌入技术算法

算法1:node2vec算法

learnfeatures(graph g = (v,e,w))

π=preprocessmodifiedweights( g,p,q )

g =( v,e,π )

initialize walks to empty

for iter = 1 to r do

for all nodes uv do

walk=node2vecwalk( g ,u,l )

append walk to walks

f( u )=stochasticgradientdescent( k,d,walks )

return f( u )

node2vecwalks(graph g = (v, e, π ))

initialize walks to [u]

for walk_iter = 1 to l do

curr = walk[-1]

v curr =getneighbors( curr, g )

s=aliassample( v curr ,π )

append s to walk

return walk

3.3.2. 构造社交维度工人–任务匹配度矩阵

1) 构建工人亲密度矩阵s s ik 为工人亲密度矩阵s中的元素,表示工人i与工人k之间的社交相似度,计算方法如公式(11)所示:

s ik = f( i )f( k ) f( i ) f( k ) (11)

其中, f( i ) f( k ) 分别为两个工人的特征向量。

2) 构建工人任务参与度矩阵p p kj 为工人任务参与度矩阵p中的元素,代表工人k对任务j的参与总次数。计算方法如公式(12)所示:

p kj = l=1 n t kj ( l ) (12)

其中, t kj ( l ) 的值为1,代表了工人k对任务j的一次参与,l为工人k对任务j的第l次参与,n为参与的总数。

3) 生成社交维度工人–任务匹配度矩阵 m social m ij social 为社交维度工人–任务匹配度矩阵的元素,表示工人i对任务j的匹配度。具体计算方法如公式(13)所示:

m ij social = k s ik p kj (13)

其中, p kj 为工人任务参与度矩阵p中的元素,表示工人k对任务j的参与度。

3.4. 基于bp神经网络的多维度工人–任务匹配度矩阵生成

在多维度工人行为分析融合模块中,利用bp神经网络对上述三个维度的工人–任务匹配度矩阵进行融合,生成多维度工人–任务匹配度矩阵,bp神经网络结构如图4所示。

figure 4. the structure of bp neural network

4. bp神经网络结构示意图

1) 归一化:将时间维度工人–任务匹配度矩阵、空间维度工人–任务匹配度矩阵、社交维度工人–任务匹配度矩阵三个矩阵进行归一化, m ij m 为各个维度矩阵的元素,代表对应维度工人i与任务j的匹配度,计算方法如公式(14)所示:

m ij m = m ij m m min m m max m m min m (14)

其中, m{ time,space,social } m min m 为输入各个维度矩阵中的最小值, m max m 为输入各个维度矩阵中的最大值。

2) 输入层:将归一化后的矩阵用于神经网络的输入和目标,输入层包括归一化后的时间维度工人–任务匹配度矩阵 m time ,空间维度工人–任务匹配度矩阵 m space ,社交维度工人–任务匹配度矩阵 m social

3) 隐藏层:使用relu激活函数,公式如(15)所示:

h=relu( wx b ) (15)

其中h为隐藏层输出,w为输入层到隐藏层的权重矩阵,b为隐藏层的偏置向量,x为训练的批量样本。

4) 输出层:输出层根据隐藏层的特征表示,将其映射到最终的输出空间,得到最终的工人-任务匹配度矩阵m,公式如(16)所示:

m= w h b (16)

其中m即为最终生成的多维度工人–任务匹配度矩阵,h为隐藏层的输出, w 为输出层的权重矩阵, b 为输出层的偏置向量。

5) 损失函数:以工人对任务的签到次数作为多维度工人–任务匹配度矩阵中的实际匹配度,损失函数如公式(17)所示:

loss= 1 n i=1 n ( m ij m ij ^ ) 2 (17)

其中,n为评分矩阵元素数量, m ij 为工人i和任务j的多维度实际匹配度, m ij ^ 为工人i和任务j的多维度预测匹配度。

训练好的bp神经网络可以用来计算工人和任务之间的多维度匹配度,生成最终的多维度工人–任务匹配度矩阵。根据生成的最终多维度工人–任务匹配度矩阵,可以得到每个工人对每个任务的评分,然后得到工人推荐任务列表,最后选取评分最高的n个任务对工人进行top-n任务推荐。

4. 实验结果与分析

4.1. 数据集

本实验采用的数据集gowalla,该数据集包含了196,591个用户从2009年8月至2010年9月的签到记录。每条签到记录包括用户id,签到时间,签到地点的纬度,签到地点的经度,以及每个地点的经纬度所唯一对应的地点id。鉴于数据中用户的签到地点较为广泛,所以本文筛选了位于纽约市的数据,并且通过对工人的签到地点以及签到次数进行筛选,共筛选出12,319条数据,包含161个工人和179个地点,试验数据以8:2的比例随机划为训练集和测试集,从而更准确地评估模型的性能。

4.2. 评价指标

本实验推荐结果采用常用的top-n列表的形式,评价指标选取准确率precision、召回率recall和f1 score。其中precision表示推荐列表中的物品属于测试集的比例,recall描述测试集中的物品占推荐列表的比例,f1 score表示准确率和召回率的调和平均值,综合考虑了模型的准确率和召回率。f1 score越高,表示模型在准确率和召回率之间取得了更好的平衡。公式如下:

precision= uu | r( u )t( u ) | uu | r( u ) | (18)

recall= uu | r( u )t( u ) | uu | t( u ) | (19)

f1score=2× precision×recall precision recall (20)

其中 | r( u )t( u )| 为正确推荐的数目, | r( u )| 为推荐的任务数目, | t( u )| 为工人实际参与的任务数目。

4.3. 参数设置

4.3.1. lfm模型

主从给定的文件中读取数据,这些数据包含了用户的签到记录和签到时间,将签到时间转换为时间戳,并以参考时间为基准计算时间衰减因子,用于衡量签到时间的影响。根据用户和任务的签到记录,构建初始的工人–任务匹配度矩阵。使用隐语义模型进行矩阵分解,通过学习用户和任务的隐含特征向量来表示它们之间的关系,利用随机梯度下降算法(sgd)更新模型参数,以最小化预测评分与实际评分之间的差异。采用余弦相似度作为评分预测的指标,并根据差异调整模型参数,以提高评分预测的准确性,通过计算最终预测矩阵与初始矩阵非零部分的均方误差(mse),对模型的性能进行评估,保存最终时间维度工人–任务匹配度矩阵 m time ,参数设置如表2所示。

4.3.2. bi-lstm模型

使用bi-lstm模型进行用户位置预测任务。该模型包括一个嵌入层、一个双向lstm层和一个线性输出层,定义模型的结构和超参数,包括输入维度、隐藏维度、lstm层数、输出维度等。使用交叉熵损失函数和随机梯度下降(sgd)优化器进行模型训练,在训练过程中,定期输出当前的训练损失和准确率,并在每个周期结束后对测试集进行评估,计算测试误差和准确率。保存取得最佳准确率的模型参数,加载训练好的模型,并利用该模型对测试集中的数据进行推断,以预测用户的下一个位置。根据用户位置和任务位置之间的距离计算余弦相似度,构建并保存空间维度工人–任务匹配度矩阵 m space ,参数如表3所示。

table 2. lfm parameter setting

2. lfm参数设置

参数名称

参数值

时间衰减因子

0.01

隐含特征数量

15

正则化参数

0.02

学习轮数

30

学习率

0.1

table 3. bi-lstm parameter setting

3. bi-lstm参数设置

参数名称

参数值

学习轮数

500

批处理大小

32

学习率

0.005

传播层数

3

dropout

0.2

4.3.3. node2vec图嵌入技术

使用networkx库构建一个无向图,其中每个节点代表一个工人,边表示工人之间的社交关系,遍历社交网络边数据,将边添加到图中,使用node2vec算法对构建的社交网络图进行训练,以学习节点的嵌入表示,进行多次随机游走,从每个节点开始,沿着边随机游走一定步数,并记录下每次游走的路径,使用word2vec算法将这些随机游走路径转换为节点的嵌入向量。定义一个用于计算余弦相似度的函数,用于衡量两个节点嵌入向量之间的相似度。使用定义的余弦相似度函数,计算工人之间的社交匹配度矩阵,其中每个元素表示两个工人之间的社交相似度,计算工人和任务之间的参与度矩阵,其中每个元素表示一个工人参与一个任务的次数,将社交相似度矩阵和参与度矩阵相乘,得到了社交维度下的工人–任务匹配度矩阵 m social ,参数设置如表4所示。

4.3.4. bp神经网络

读取三个匹配度矩阵: m time m space m social ,对这三个矩阵进行归一化处理,使用minmaxscaler进行归一化。定义一个多层感知器模型,包含一个输入层、一个隐藏层和一个输出层。输入层的大小为三个归一化矩阵的特征数之和,隐藏层大小为50,输出层大小为工人–任务矩阵的列数。使用均方误差(mse)作为损失函数,使用随机梯度下降(sgd)作为优化器,学习率设置为0.1,将归一化后的矩阵转换为pytorch张量,用于神经网络的输入和目标。在循环中进行模型的训练,迭代次数为20,000次,在每个epoch中,执行前向传播、计算损失、反向传播和优化,计算模型的均方根误差(rmse)和平均绝对误差(mae),使用训练好的模型对测试集进行预测,得到最终的多维度工人–任务匹配度矩阵m,参数设置如表5所示。

table 4. node2vec parameter setting

4. node2vec图参数设置

参数名称

参数值

窗口大小

5

随机游走长度

10

返回概率参数

1

离开概率参数

1

学习轮数

10

随机游走序列个数

10

特征向量维度

64

table 5. bp neural network parameter setting

5. bp神经网络参数设置

参数名称

参数值

学习轮数

2 × 104

隐含层大小

50

学习率

0.1

4.4. 性能对比

为了验证该综合模型推荐方法的有效性,本文对上述的时间维度、空间维度、社交维度和综合模型4种推荐方式进行比较,根据4种方式推荐的任务数目,分别计算n (n = 5, 10, 15, 20)时的准确率precision@n、召回率recall@n和f1 score,绘制图像后结果如图5所示。

figure 5. (a) comparison of top-n precision for four models; (b) comparison of top-n recall for four models; (c) comparison of top-n f1 score for four models

5. (a) 四种模型top-n准确率对比;(b) 四种模型top-n召回率对比;(c) 四种模型top-n分数对比

图5可知,随着推荐任务数目n的增大,准确率(precision@n)整体呈下降趋势,召回率(recall@n)逐渐上升,f1 score也逐渐上升且趋于平稳,且从高到低的顺序为综合模型–时间维度模型–空间维度模型–社交维度模型。在不同的推荐任务数目n下,综合模型的precision@n、recall@n和f1 score均优于单独的时间维度、空间维度和社交维度模型。由此可说明在推荐工人任务时,本文的综合模型更为准确,能为工人提供更好的服务体验。

表6可见,由于数据集经过筛选后,每个工人参与的任务较少,随着推荐任务数目的增加,真正匹配工人兴趣的任务比例会相应减少,从而导致准确率下降。在推荐任务数目为5时,综合模型的准确率能够达到0.9333,而当推荐任务数目增至20时,准确率下降至0.6863,但仍保持较高的推荐精度。从整体来看,综合模型在不同推荐任务数下的准确率始终高于其他三个单一维度模型;由表7可见,随着推荐任务数量的增加,任务覆盖率随之提升,因此召回率也逐渐上升。在推荐数目为20时,综合模型的召回率达到0.7179,在不同推荐任务数目下,综合模型的召回率均优于单维度模型;由表8可见,随着推荐任务数量的增加,召回率的提升速度通常快于准确率的下降,特别是在数据稀疏的情况下,召回率的提升显著推动了f1分数的上升。综合模型能够从多个维度捕捉工人的行为偏好,即使准确率有所下降,模型仍能依靠较高的召回率保持较高的f1分数。在推荐任务数目为20时,综合模型的f1分数达到0.7018,展现出在准确率和召回率之间的良好平衡,整体推荐效果优异。

综上所述,本文提出的综合模型在三个评价指标(准确率、召回率、f1分数)下均优于单一维度模型,能够深入挖掘工人的时空偏好变化,提升任务推荐的准确性与覆盖率,并有效缓解了社交网络数据稀疏性问题,进而使任务推荐更加精准。

table 6. accuracy of different models at different recommendation lengths n

6. 各模型在不同推荐长度n的准确率

模型

5

10

15

20

综合模型

0.9333

0.8424

0.7555

0.6863

时间维度模型

0.7151

0.5333

0.4121

0.3409

空间维度模型

0.4545

0.3242

0.2586

0.2258

社交维度模型

0.1879

0.2090

0.1717

0.1636

table 7. recall of different models at different recommendation lengths n

7. 各模型在不同推荐长度n的召回率

模型

5

10

15

20

综合模型

0.2441

0.4406

0.5927

0.7179

时间维度模型

0.1870

0.2789

0.3233

0.3566

空间维度模型

0.1189

0.1696

0.2029

0.2361

社交维度模型

0.0491

0.1094

0.1347

0.1711

table 8. f1 scores of different dimensions at different recommendation lengths n

8. 各维度在不同推荐长度n的f1分数

模型

5

10

15

20

综合模型

0.3869

0.5786

0.6643

0.7018

时间维度模型

0.2965

0.3663

0.3623

0.3486

空间维度模型

0.1884

0.2227

0.2274

0.2308

社交维度模型

0.0779

0.1436

0.1510

0.1673

5. 结束语

目前移动群智感知领域两大主要的任务推荐方法:基于时空信息的任务推荐方法与基于社交网络信息的任务推荐方法,分别存在着忽略了工人偏好的时空变化与存在数据稀疏性问题。此外,还存在着多源异构数据融合问题。针对这些问题,本文综合考虑了工人地理位置、时间可用性以及社交网络关系多种因素,提出了基于多源异构数据融合的移动群智感知任务推荐算法。基于隐语义模型、双向长短时记忆网络模型分别生成时间维度工人–任务匹配度矩阵、空间维度工人–任务匹配度矩阵来挖掘工人偏好的动态变化以进行任务推荐,基于node2vec图嵌入技术模型生成社交维度工人–任务匹配度矩阵环节数据稀疏性问题,然后基于bp神经网络将以上三种工人–任务匹配度矩阵进行融合生成多维度工人–任务匹配度矩阵,实现工人行为多源异构数据的融合,并进行任务推荐。最后通过计算模型本身与模型变体的precision、recall和f1 score性能指标来对比推荐效果,证明了本文算法能够在提高任务推荐准确率的同时实现多维度覆盖。

在今后的工作中,将考虑更多可能影响移动群智感知任务推荐效果的因素与多源异构数据融合方法,进一步提高任务推荐的精确度,为工人提供更好的服务体验。

参考文献

[1] 江海峰, 商景杰, 王树豪, 等. 移动群智感知中发掘潜在高质量用户的激励机制[j/ol]. 小型微型计算机系统: 1-8.
, 2024-06-06.
[2] 童咏昕, 袁野, 成雨蓉, 等. 时空众包数据管理技术研究综述[j]. 软件学报, 2017, 28(1): 35-58.
[3] li, n., mo, w. and shen, b. (2016) task recommendation with developer social network in software crowdsourcing. 2016 23rd asia-pacific software engineering conference (apsec), hamilton, 6-9 december 2016, 9-16.
[4] yang, g., li, y., he, x., song, y., wang, j. and liu, m. (2021) profile-free and real-time task recommendation in mobile crowdsensing. ieee transactions on computational social systems, 8, 1311-1322.
[5] wang, s., zhang, l., yu, m., wang, y., ma, z. and zhao, y. (2020) attribute-aware multi-task recommendation. the journal of supercomputing, 77, 4419-4437.
[6] 王晓. 基于多模态信息融合的移动群智感知任务推荐方法[d]: [硕士学位论文]. 哈尔滨: 哈尔滨理工大学, 2023.
[7] ji, y., mu, c., qiu, x. and chen, y. (2022) a task recommendation model in mobile crowdsourcing. wireless communications and mobile computing, 2022, article id: 9191605.
[8] zhao, b., dong, h. and yang, d. (2023) a spatio-temporal task allocation model in mobile crowdsensing based on knowledge graph. smart cities, 6, 1937-1957.
[9] lai, c. and zhang, x. (2020) duration-sensitive task allocation for mobile crowd sensing. ieee systems journal, 14, 4430-4441.
[10] ding, y., zhang, l. and guo, l. (2022) dynamic delayed-decision task assignment under spatial-temporal constraints in mobile crowdsensing. ieee transactions on network science and engineering, 9, 2418-2431.
[11] shen, x., chen, q., pan, h., song, l. and guo, y. (2022) variable speed multi-task allocation for mobile crowdsensing based on a multi-objective shuffled frog leaping algorithm. applied soft computing, 127, article id: 109330.
[12] 乐梦云. 基于知识图谱和社会网络的推荐算法研究及应用[d]: [硕士学位论文]. 北京: 北京邮电大学, 2021.
[13] chen, s., zhao, x., liu, j., gao, g. and du, y. (2022) social-network-assisted task recommendation algorithm in mobile crowd sensing. 2022 the 7th international conference on information and education innovations (iciei), belgrade, 14-16 april 2022, 136-142.
[14] wang, s., wang, x., yang, y. and cai, h. (2016) based point of interest and experience to task assignment on location-based social networks. 2016 12th international conference on mobile ad-hoc and sensor networks (msn), hefei, 16-18 december 2016, 81-85.
[15] li, y., hsieh, c., lin, l. and wei, c. (2021) a social mechanism for task-oriented crowdsourcing recommendations. decision support systems, 141, article id: 113449.
[16] li, z., cheng, b., gao, x., chen, h. and chen, g. (2021) a unified task recommendation strategy for realistic mobile crowdsourcing system. theoretical computer science, 857, 43-58.
为你推荐
凯发国际一触即发的友情链接
网站地图