隐私信息描述、迭代延伸控制、出行服务应用场景、信用计算应用场景示例.docx
附录A费料性)隐私信息描述示例A.1假述隐私伯恩可由障私信息六元组描述,具体如下:a)障私信息向量:,根据文件标识符确定信息的类型,并根据语义特征将信息进行拆分,得到n个在语义上不可分割的陷私信息分量,则肥私信息向吊可以表示为I=(id,i1.,0).其中k为取值范围从1到n的正卷数:b)约束条件集合,由隐私信息分房对应的约束条件向后组成的集合8=(1.2-,k,n),用于描述在不同场景下实体访问陷私信息分3*所襦的访问权限根据除私信息向城中的隐私信息分量的应用场景,可对隐私信息分量设置相应的约束条件向法*=(uk.tk,d1.t,n1.c),表示第k个隐私信息分量的约束条件,其中.UIt表示访问者列入,外衣示访问时间,心表示访问设备,川丧示网络标识:C)2和典性向I匕通过预先标记或障私保护程度吊化操作海数,站合约!U条件集合,时隐私信息向量进行隐私度瑞,度量结果存入隐私属性向瑞/1=(a1.,a2,-,an,-.am),可假设初始所有隐私属性分成为1(假设做私碣性分量的范围为O到1.隐私展性分晟越小,其对应的I®私信息分员的保护程度越南):d)广义定位信息集合,分别茯取验私信总分量在信息中的广义定位信息向信以、丫?、丁,由此生成广义定位信息集合r=(,>j,加,/;e)审计捽制信息集合.分别获取隐私信息分批的审计控制信息向盘0,3z,n.在初始化阶段,审计控制信息向量:可以为空,记录当前持有者对除私信恩分现进行的所有操作,由此生成审计拄制信息集合n=1,2,-,11);f)传播控制操作集合,针对除私属性向埴和约束条件集合,根据操作判别函数或人工标记生成院私信息向量:及其组合的传播控制操作集合甲=1-Pn).在初始化阶段,传播控制操作向信可以为空,根据流传过程中对隐私伯息分量的传播要求.逐渐添加得到传播控制操作向川甲z,甲n共同组成传播控制操作集合。A.2隐私信息描述六元组生成过程本附录以文本、图像模态数据为例,介绍陷私信息描述的生成方法和过程,供设计实现私信息描述与处理功能时多考,针时待处理的多愎态数据,进行防私抽取,确定的私信息分量模态,并进行定位,生成胞私信息向量和广义定位信息集合:通过除私数据分类分级规则对识别和抽取的隐私信息分t进行分类,根据分类结果确定隐私信息向量的约束条件集合:根业:的束条件集合以及隐私数据分类分级规则对隐私估息向址进行陷私度属,生成除私属性向量和传播控制愫作集合;记录时除私信息向信执行的所有操作,生成审计控制信息集合。除私信息描述六元蛾生成过程如图A.1所示。T模态数据I传播控制I排作汆合广义定位信息妪合约束条件蛆合计制息合审控(s图.1.的私信息描述六元组生成过程A3文本类隐私信息描述生成示例A.3.1隐私信息向量陌私信息向Ift生成过程如下;a)除私信息处界并根据文件标识符等信息确定信息的类鞭,并读取其内容,例如:可以通过APHehePoi等工具读取Hord文档信息、EXCe1.表格信息:通过Spire.PDF等工具读取PI)F文档信恩:b)通过正则文本匹配、自然语言处理识别文件中的除私信息并进行切割。以文本信息“张三和李四去中关村参加活动”为例,使用荔于Bi1.SnI-CRF模型的命名实体识别算法对姓名、组织名.地名等实体进行识别:c)生成隐私信息向眼/=(id.张三和,力纵去,中关村,参加,活动).A3.2约束条件集合约束条件集合生成过程如下:a)陷私信息处理者获取文本类数据对应的分类分级规则:b)根据当前私信息处理者的超愿,生成够和信息向后对应的约束条件集合,例如:若当前除和信总处理者仅向197.224.*.*网段的用户赋予文档读H权限,则非该网段下的用户无法读取该文件:c)生成约束条件集合a=(读写,197.224.).A3.3隐私属性向量吃私属性向量生成过程如下:a)防私信息处理者根据文本类数据对应的分类分级规则和陷私信息分奴的约束条件集合,确定恃处理文本信息对应的分类分级规则:b)根据约束条件集合、分类分级规则以及文档创建者的意愿,通过预先标记或隐私保护程度量化操作函数,依次计算隐私信息向J和隐私信息分量组合对应的防私属性向fit,生成各个除私信息分量的隐私网性向量:C)如段值结果为。,包含莅至Xn的除和屈性向量可表示为由=(XiXn,0.4)O广义定位信息集合生成过程如下:a)除私信息处埋并采用合适的位置标识信息,对隐私信息在文档中的位置进行编码“例如:1) Wrd文档可利用页码、段落、行数、起始位和终止位等表示定位信息:2) Exce1.表格可利用表单号、行号、列号等表示定位信息.b)生成陷私信息分Ift对应的广义定位信息向S1.例如:对于Word、Kxce1.文档,可使用APaehepoi工具为唠私信息向小进行索引,统一设置字符在文档中的范国标签和批注引用,生成广义定位信息集合;c)生成广义定位信息集合r.例如:D八=(左,尸11,鼻*2,0,4)表示记为XIIS私信总分量“张三”,位于文本信息的第11页、第3段中的第2行,起始位为0,终止位为4;3) 2=(X2,T1,Rs,C4)表示记为X2隐私信息分量”321128202502012921”,位于表格的表单1、第5行中的第4列的单元格中.A.3.5审计控制信息集合审计控制信息集合生成过程如下:a)隐私信息处理者记录其对文档的隐私信息分出进行的所有操作,并生成审计控制信息集合:b)将生成的审计控制信息能合存储于财应的I®私信息描述六元组,A.3.6传播控制操作集合传播控制探作集合生成过程如下:a)或私信息处理者获取文木类数据对应的分类分级规则和除私信息分W的约束条件集合、险私属性向量;b)根据当前隐私信息处理者流转共享意愿,生成吃私信息向量对应的传播控制操作集合.例如:当前的传播控制操作佻合W=1%,甲2,%,假设当前陷私信息处埋者只希望除私信息分址“中关村”被更制转发,则可新增一个传播控制操作向址,=(转发,复制),生成新的传播控制掾作集合中=1,2,3,J,1.¾私信息六元组的生成结果如图A.2所示.识别文档中的隐私信息实体.例如:“北京市消防局”记为片,X的位置在文档中的第2页、第2段、第2行上,起始位置是35,终止位汽是41.提取外部文木数据分类分级规则,结合使用意愿,得到其对应的总和阀性向量为a1=(X1,0.4),表示隐私信息分埴X1的盼私属性度埴结果为04.约束条件集合“约束该文档只能在197.224.*.网段中被查看,并且叼控制后域流转过程中该隙私信息分量只能被转发、契制.传播控制操作集合叫=(U/O”红制,转发;。/%,转发,修改)我示隐私伯恩分量“北京市消防局“先后被唯标识为,/名和WDZ的用户访问和操作过,其中"W/,复制,转发”表示隐私信息分琏“北京市消防局“被用户。/历执行了H制、粒发的操作:当该除私信息分出传播至用户山6则被执行了转发和修改的操作.Ha.*ce个州0的鲤序.anxftfc<rMfiu,t内女星左看入假M险,。I口MS介乂"冷A<HfHWta*赠的NJKJ<r<*er-(1KW22<.)1.-(r)«i-(X1.04),"(wo1.axffw.55用化也电2rRziu力.AtniiKwttWtt*ntt*c.依例龄人AK代我门、钎%6大过失夕龊rmx火.ma><<f.怅4介4不负<1m*Mh0omm4n<.纥次火灾i阴是任贝IiWi1.1.UI.电权用Nir¥次Mi卡墓.1次-18,KftMft*11.ftM*ii%*k9V*tt"但育人假“*总*火帽新城火火事皎秀的U宣ftWttftA<4MrKKM4AMA食KrItAUffN公k曲曲及A><>9RHttRMZ<*<IMA*eXANMtt*W<MeM文火得失H五S假M*WK*VTtVi,入4ni"W1."帽"aKM欠化中。野,麴父尸图A.2Woai文档隐私信息描述生成结果A.4图片类隐私信息描述生成示例A.4.1隐私信息向量图片中的隐私信息向M生成过程如下:a)在图片分享过程中,图片持有者使用EXirrO01、exifread等开源工具/函数库读取图片EXIF数据中的拍摄时间、拍摄经绊度、焦距等敏感信息:b)通过图像处理算法识别图片像素区域中的敏感内衣.例如:一张图片同时出现张三和李四在医院门口下私家车,图片拍摄者为张五。其中,张三人脸、李四人脸、私家车车牌、医院标识即为敢超内容:c)符识别的敏感内容作为隐私信息分量(张三人脸、李四人脸、私家车车牌、医院标识)存储在EXif信息的IFD(ImageKi1.eDirectory)结构的自定义区域,命名为息分量信ivacyInfoEntry中。A.4.2约束条件集合图片中的约束条件集合生成过程如下:a)可通过一些外在信息判定敢感信息的约束条件,例如,图片像索的张三人脸区域、李四人脸区域、私家车车牌号区域、医院标识区域,访问者-访问客体信息Y=«张五,私家车车牌号区域赵六.医院标识区域>约束条件:b)可通过ExifToo1.、exifread等开源工具/函数库,将约束条件写入Exif信息的IFD结构自定义区域中的约束条件ConstraintEntryt1.,.A.4.3隐私属性向量图片中的隐私属性向Ia生成过程如下:a)通过图片内容私检测算法、合影人员亲密度检测算法等工具识别私家车车牌号区域、张:.人脸区域、赵四人脸区域、医院标识区域的敏感程度:b)根据用户的吃私需求设巴图片像素的私家车车牌号区域的隐私级别为IqVeI1:张三人险区域.赵四人脸区域的隐私级别为1.eVe1.2:医院标识区域为1.eVeI3:C)通过EXirrg1、。Xifread等开源工具/函数库,写入在EXif信息的IH)结构的阳私属性向量PriVaCyRtribuCiOnEntry中。A.4.4广义定位信息集合图片中的广义定位信息集合生成过程如下:a)通过图像分割算法标记图片像素的张三人脸区域、李四人脸区域、私家车车牌号区域、医院标识区域,将每个区域的坐标、位置等元数据存储的EX1.FEn1.ry名称等广义定位信息:b)通过ExifToo1.,CXifrCad等开源工具/函数库,将这叫广义定位信息记录在Exif信息的IFD结构的广义定位信息1.ocatiOnEntry中.A.4.5审计控制信息集合图片中的审计控制信息集合生成过程如Ma)招用户对图片中张三人脸区域、李四人脸区城、私家车车牌号区域、医院标识区域等除私(S息的复制、转发、谑镜、套切等操作进行记录:b)通过EXifTo。1、exifread等开源工具/函数库,将记录写入IFD结构的审计控制信息AUdi1.EntrytP,审计控制操作AuditEnIry下可以设置子IFD.用于动态扩充后续审计控制操作集合:C)当出现违规行为时,可通过定制程序读取所有审计控制操作,通过比对隐私佑息的约束条件进行违规行为判定,A. 4.6传播控制操作集合图片中的传播控制操作集合生成过程如下:a)将图片像素的张三人脸区域、李四人胎区域、私家车车牌号区域、医院标识区域的转发、删除、女制等传播操作进行记录:b)通过EXifToO1.eXifread等开源工具/函数库.记录在EXif信息的IFD结构的传播控制操作Contro1.Entry,传播控制操作Contro1.Entry下可以设置子】FD,用于动态扩充后续传播控制操作