近代中国的社会性质网络分析中节点的性质能不能不相同

马方:犯罪网络分析:社会网络分析在有组织犯罪研究中的应用
的结构及其属性。
社会网络分析是当代社会科学多学科融合的结晶。一般认为当代社会网络分析有三个渊源:“社会计量学者,他们通过研究小群体,在技术上从很多方面推进了图论方法的发展:1930年代的哈佛‘派系’学者研究了人际关系的模式,提出了这个概他们在前两种传统的基念;曼彻斯特的人类学家,
‘社区’”础上考察了部落和乡村的关系结构。社
己拥有的企业,并进行商业化运作,其中不同的犯罪人或团伙分担不同的任务,这些相互关联的犯罪人构成了一个犯罪网络。
犯罪网络除具有社会网络的一些特点外,还具有以下特征:其一,网络中的节点代表犯罪分子,节点间的边表示犯罪分子之间的联系,如消息传递,共同参与某项活动。其二,各节点在网络中的作用“位置”或者基本不同,核心成员往往掌握犯罪团伙重要信息,属于网络的少数。其三,大的犯罪网络往往由几个子团伙组成,在整个团伙中各子团伙起着不同的功能作用。其四,犯罪团伙并不是孤立存团伙间存在一些联系和交互。在的,
“明星”二、犯罪网络中的角色与地位
在分析犯罪网络的过程中,通常主要关注于犯罪网络结构的诸多特征以查明下述问题:犯罪网络中心人物是谁?网络中存在哪些团伙?团伙之间互动关系类型有哪些?犯罪网络的全貌结构是什么?打击哪些犯罪成员能够破坏整个犯罪网络?信息与物品在犯罪网络中如何流动?这些犯罪网从而有络结构特征能够直接发现犯罪网络的命门,即效指导司法工作。其中发现犯罪网络中心人物,“明星”社会网络分析中的是分析犯罪网络的基础与前提。只有识别犯罪网络中心人物,才能掌握犯罪网络结构,最终制定针对性的破坏犯罪网络对策。
德国学者雅各布·莫雷诺(JacobMoreno)在其“明星发明的社群图中使用的一个核心概念是社群(star)”,“明星”此处所谓是指在群体中最受欢迎,或者最受人们关注,从而拥有极大声望和领导地位的人
[2]9,68
会网络分析是在研究人际关系的过程中,适用数学、统计学、社会学、人类学等多学科成果与理论所形成的知识体系,在其发展初期主要是作为一种研人类学究方法或研究工具被用来进行相关社会学、,“社会研究,但随着社会网络分析方法的不断拓展网络分析不仅是一种社会研究的具体方法,更是一种研究社会结构关系的新观点。社会网络是人类关系特征的突出表现形式,它集中体现了社会的结社会网络分析并不限于微观的个体构属性。而且,
互动层面,它也可用于分析宏观的社会现象,如组
”织结构、社会关系甚至国际关系等。正如著名的
:“网加拿大社会网络分析家BarryWellman所指出——隐藏在复杂的社会络分析探究的是深层结构—
[4]”系统表面之下的一定的网络模式。
社会网络分析(也被称为社会网络科学或网络社会学networkscienceornetworksociology)的基本观点认为个体结点(依据网络类型的不同,该结点可以是个人,事件等等内容)被一些复杂但是可以理解的关系所联接并因此构成诸多网络。整个社会正是由这些网络所构成,这些网络无处不在,遵循基本的秩序与简单的规则。网络是许多事件、组织与社会进程的基础。
“网络”(networks)一在刑事司法领域所使用的
词通常是指犯罪组织。如恐怖袭击、毒品交易、走黑社会等犯罪行为在很大程度上是由多个相互私、
联系的个体共同实施,此类犯罪在犯罪学中将其定义为有组织犯罪。基于共同故意和一定组织结构而共同实施犯罪是有组织犯罪的基本特征,例如在贩卖毒品犯罪中,犯罪人必须相互合作实施一系列包含组织货源、运输、分配到销售、洗钱犯罪行为,
等多个环节。犯罪人在实施犯罪过程中会形成自
。对群体中“明星”的关注是社会网络分
个体行动者或组织在其社会网析的起点问题之一,
络中的地位、作用如何,一直是社会网络分析的重。“要内容与基础理论中心度是分析社会网络的一个最重要的和常用的概念工具之一。它是关于行动者在社会网络中的中小型位置的测量概念,反映的是行动者在社会网络结构中的位置与优势的差
西南政法大学学报
点中心度(pointcentrality)是社会网络中心度“明星”测量的基础概念。点中心度的概念来自于,“一个核心点概念,其目的在于发现网络的核心点‘核心’是指处于一系列联系的位置的点,该点与其
”他各点具有众多直接的联系。计算点的度数是
在特定网络中区分中心组织者、边缘参与者与外围“绝对中心”,“一个成员。一个标准的结构中心是
它是一个图在图的绝对中心与圆心或球心很相似,
构成时所围绕的那个核心点。图的结构中心作为点集并不满足这个标准。绝对中心必须是单个的
”点。图的绝对中心是在路径距离上与图中所有
对点中心度最简单、最直接的测量,与测量点直接点的度数说相连的其他点的个数就是该点的度数,
明该行动者在网络中与其他行动者之间关联紧密“明星”,程度,点数最高的行动者是该网络的或者说处于网络中心、领导地位。社会网络中心度测量一般可分为局部中心度(localcentrality)与整体中心度(globalcentrality)。对点中心度的测量所形成的度数就是局部中心度,该度数实际上主要取决于网络的规模,同时局部中心度只能在同一网络成员而对局部之间或相同规模网络成员之间进行比较,中心度测量更加标准化的测量指数是局部中心度“,相对测度”即点的实际度数与可能联络的最多的度数之比
其他点最接近的点。
在社会网络中处于中心、领导地位的不仅仅是“明星”中心度数较高的人物,点中心度数较低但中间度数较高的中间人同样可能成为网络的中心。中间度(betweenness)也是一种点中心度概念,中间度测量的是一个点在多大程度上位于图中其他点“中间”,也就是测量行动者之间的依赖性,如果的
一个行动者处于多对行动者之间,他的中心度数一而中间度数较高,反映其他行动者对其具般较低,
有较高的依赖性,由于这种依赖关系所产生的重要“中介”作用,该行动者因而处于网络的中心,因为“处于这种位置的个人可以通过控制或曲解信息的
[6]传递而影响群体”。
。整体中心度又称为接近中心度
(closenesscentrality),整体中心度测量各个点之间即不同点之间的距离,此处的距离是两的接近性,
点之间最短途径(捷径geodesic)的长度。整体中心度是图中该点与其他各个点之间的捷径距离之和。整体中心度主要反映网络之中各个行动者的密切程度,整体中心度较低的行动者与其他行动者之间联系最为紧密,因而属于网络中心人物。
中心势(centralization)与中心度经常容易混,“如果把中心度这一术语斯科特为此特别澄清淆,
严格地限制为点的中心度,而中心势则特指作为整
”体的图的中心度。中心势与密度共同测量一个
“如果说明星”人物由于其中心地位在群体中享有强关系,而中间人具有的是一种弱关系。格兰从四诺维特提出弱关系是传递信息的有效的桥梁,`情感强度、个维度来测量关系的强弱:互动的频率、
亲密关系和互惠交换。通过对关系强弱的界定,格氏提出强关系是群体内部连接的纽带,而弱关系则是群体之间的纽带。群体内部由于身份地位的相导致信息的重叠;而由弱关系联系着不同的同性,
群体则掌握着不同的信息,弱关系充当着信息桥的作用。桥(bridge)在信息的传播过程中是不同群体
间信息流通的关键。这就是弱连带优势理论。
图及其所反映网络的集中程度。密度是图中实际存在的连线与所有可能存在连线之间的比例,其所反映的是社会网络关系的密切程度,密度越大,表。“密度指的是一个明网络成员之间的关系越密切
图的凝聚力的总体水平;中心势描述的则是这种内聚性能够在多大程度上围绕某些特定点组织起
”来。图中最核心点的中心度和其他点的中心度
结构洞是对中间度概念的进一步描述。博特(RonaldBurt)所谓结构洞,是社会网络的两种类型“社会网络中的某个或某些个体和有即中的一种,
些个体发生直接联系,但与其他个体不发生直接联系。无直接或关系间断(disconnection)的现象,从网络整体看好象网络结构中出现了洞穴
的差值总和,与最大可能的差值总和之比就形成中心势指数。中心势指数可以测量图中是否存在一“结构中心”,种由单个点或一个点集所构成的从而
论角度看,当两个点不直接相连,而是通过第三点这两点之间就存在一个结构洞。间接相连的时候,
结构洞的存在使得第三者扮演经纪人或者中间人
猜你喜欢的内容。。。
……犯罪网络分析_社会网络分析在有组织犯罪研究中的应用_教育学心理学_人文社科_专...
……犯罪网络分析:社会网络分析在有组织犯罪研究中的应用 在刑事司法领域所使用的网络(networks)一词通常是指犯罪组织。一个犯罪网络首先也是一个社会网络,社会网络分析......
……社会网络分析在打击有组织犯罪中的运用_专业资料。人的生活根植于社会之中,人与人的相互接触形成相应的社会关系网络。社会网络分析方法运用于公安工作,对公安机关打击......
……社会网络分析 在打击有组织犯罪中的应用 ? 引言 ? 什么是社会网络分析 ? 社会...? 社会网络分析在打黑除恶中的应用 ? 目标 ? 分析犯罪组织中的派系,为......
……社会网络分析及其应用案例 6页 1财富值如要投诉违规...量分析各成 员在 犯罪 网络 中的 地位和角色,采...组织的核心人员 : 2犯 任务的研究. 以及 网络 ......
……31 1 社会网络分析在组织管理研究中的应用 绪论 1 背景介绍社会网络分析是当代西方主流社会学的一个重要的研究方向, 作为一种研究 范式和一个具体的研究......
……社会网络分析在团伙诈骗犯罪侦查中的应用_教育学心理学_人文社科_专业资料 暂无评价|0人阅读|0次下载社会网络分析在团伙诈骗犯罪侦查中的应用_教育学心理学_人文......
……浅谈社会网络分析在公安情报工作中的应用——以跨国毒品犯罪为例 数学建模,icm,...(0 0—090 01 摘要 : 境毒 品犯 罪作为有组织犯罪的一种重要表现形式, ......
……面向社会网络分析的数据挖掘方法研究_天文地理_自然...作为社会网络中的一种具 体应用,犯罪网络在911事件...犯罪网络分析【9】主要是研究组织犯罪的,比如说,......
……罪组织;偏差检测用于发现欺诈犯罪行为,网络入侵和其 ...社会网络分析已广泛应用于分析国家贸易关系、社 国家...(root)的结点;社团树研究中有下列概念,可以顾名思......
……最后 讨论了文本分析、 语义网络分析方法在犯罪信息网络分析中的应用, 并对模型...陈鹏等[ 3 ]对犯 罪组织结构的社会网络进行了研究。freeman[ 4 ]提出了一套......
……鲍杨, 朱庆华等选取了 cssci 数据库里近十年以来的全部情报学领 域的论文进行社会网络分析研究,在合著网络分析中,对“小团体” 的形成机制进行了研究。 (二......
……社会网络分析在组织管理研究中的应用与展望_企业管理_经管营销_专业资料。 第1 ...
……面向社会网络分析的数据挖掘方法是社会网 络分析中的基本而重要的功能,这一功能对于犯 罪网络分析同样基本而重要。 犯罪网络分析主要是研究组织犯罪的,例如 恐怖活动......
……了社会网络分析的发展,并探讨了其在社会学应用中的...美国研究人员也已开始发展一个正式社会 1 网络分析...了政治和政策网络、社会运动、 犯罪、恐怖主义和宗教......
……社会科学中的网络分析在过去的这个十年, 跨越物理和...改造城市社会结构的感兴趣社会学家也在用网络分析。...警察,特别是那些 和有组织犯罪作斗争的组织, 采用......
……案例分析——作者同被引可视化研究
什么是社会网络分析 人际关系网 因特网...人或者组织在社会网络中具有 怎样的权力,或者说居于怎样的中心地位,这 一思想是......
……2009 社会网络分析方法及其在创新研究中的运用邵云飞 ...提出了许多网络分析的应用理论, 这些应用理 [2] ...网络结构理论把人与 人、 组织与组织之间的纽带关系......
……? ? 社会网络分析是研究一组行动者的关系的研究 方法。 一组行动者可以是人、社区、群体、组织、国 家等,他们的关系模式反映出的现象或数据是 网络分析的焦点......
……通过分析旅游现象中存在的各种内在的网络关系特性,认为社会网络分析在旅游研究中加以应用,具有可能性与必要性,并结合...更多>>社会网络分析以一种结构性的视角,......
看过本文章的还看过。。。
您可能感兴趣。。。
最新浏览记录当前位置: >>
网络分析方法在引文分析中的整合研究
网络分析方法在引文分析中的整合研究 11:22:48 宋歌 来源:《中国图书馆学报》(京)2011 年 4 期【英文标题】Integration of Network Analysis Method in Citation Analysis【作者简介】宋歌,东南大学情报科技研究所讲师,南京市四牌楼 2
号 210096【内容提要】随着社会网络分析在各学科领域的不断渗透,复杂网络理论的兴起和可视化技术的进步,引文分析面临着研究范式 从个体主义到整体主义的转变,研究方法从统计分析到网络分析的融合。本文通过对引文网络形成过程和本质属性的探究,以及对网 络分析方法理论前提和分析原理的考察,探索网络分析方法在引文分析中的整合途径。具体包括测度引文网络整体结构特性,探究网 络结构的形成机制和演化过程,分析引文网络的细分结构、可视化引文分析过程与结果等方面的整合。图 1。表 2。参考文献 28。With the penetrating of social network analysis into more and more disciplines, the rising of complex network theory and the development of visualization, citation analysis is undergoing tremendous changes, including research paradigm change from methodological individualism to holism, research method change from statistical analysis to network analysis. By detecting the forming mechanism and the essential attributes of citation network and by investigating the theoretical premises and principles of network analysis, the paper explores the ways to integrating the network analysis methods for citation analysis, such as measuring the whole structure properties of citation network, inquiring the formation mechanism and evolution process of network structure, analyzing the subdivision structure of citation network, visualizing the procedure and results of citation analysis and etc. 1 fig. 2 tabs. 28 refs.【关 键 词】网络分析方法/社会网络分析/复杂网络理论/引文分析/整合研究 Network analysis method/Social network analysis/Complex network theory/Citation analysis/Integration research1 引言网络分析方法指主要以图论为数理基础的一种结构主义视角下的量化分析,包括社会网络分析(Social network analysis)和复杂 网络理论(Complex network theory)。这两种理论与方法都源自社会学领域,然而因论证小世界理论而引爆物理学界复杂网络研究热 潮的邓肯?瓦茨(Duncan J. Watts)却钟情于社会网络分析[1],物理学界则另起炉灶,与社会网络研究分道扬镳。随着两种理论的日 臻完善和对自然与社会现象的深入揭示,同根共源的两种理论势必在一些研究领域不期而遇。笔者发现,它们由于研究对象不同所形 成的各具特色的研究方法,正好可以融合于对引文网络的研究中。持此观点的还有大连理工大学的 WISE 实验室,他们认为:“把引文 分析、复杂网络和社会网络三种理论与方法统一起来,将可能把科学知识图谱理论与方法提高到一个新的水平。”[2]其中,对于社会 网络分析,我国文献计量学界已经作出了积极响应。陈定权[3]认为,我国同被引研究应该引入社会网络分析理论,与国外对比进行改 进。岳洪江[4]提到“引文分析只是为分析学科发展提供了一种基础数据,而社会网络分析可以利用这种引文数据揭示引文网络的结构 特征,二者的结合可以成为一种有力的分析工具”。韩毅[5]也认为“社会网络分析技术提供的结构划分方法为引文网络分析提供了在 簇水平上研究网络结构的可能性”。理念上的共识基于实践中的探索。从 1984 年加特雷尔[6](Gattrell)以社会网络分析视角对地理学期刊文献引文时序网络和同被 引网络的阐释与分析,到 1989 年哈蒙[7](Hummon)利用关键路径算法确定 DNA 理论的发展框架,再到 2003 年怀特[8](White)利用网络 分析方法对 1998 年利用多元统计方法得出的情报学作者同被引知识图谱的修正,以及近几年雷蒂斯托夫[9-11](Leydesdorff)对于期 刊及学科间引用关系的研究,显示出国外对网络分析方法在引文分析中的应用有一个循序渐进的研究过程,并且在 2000 年以后,随着 可视化技术的突破形成了研究高潮。国内的相关研究始于 2005 年,虽然研究成果不多,但研究角度较广,主要涉及对某学科引文网络 的小世界和无标度特性的验证,对某学科或主题的期刊、文献和核心作者的分析等[12-16]。本文在前人研究的基础上,通过对引文网 络形成过程和本质属性的探究,以及网络分析方法理论前提和分析原理的考察,对网络分析方法在引文分析中的整合进行初步探讨, 以期对引文分析理论、方法与实践研究提供参考。 2 引文分析中网络分析方法的选择与应用引文网络可以演绎成时序网络、耦合网络和同引网络三种类型。根据网络节点的不同还可以分为期刊引文网络、文献引文网络和 作者引文网络,它们分别是以选定研究样本中的期刊、文献和作者为网络节点的引文网络,节点之间的关系可以是引用、耦合或同引。 从图论的角度说,文献时序网络是有向非循环网络,作者同引网络是无向赋值网络。以下按引文分析目的的不同,归纳可选的网络分 析方法并说明适用情况。2.1 节点核心性测度节点核心性测度作者、文献、期刊甚至学科在其引文网络中居于怎样的中心地位和具备何种影响力,对当前的学术评价具有重要 意义。点度中心度(degree centrality)是节点的局部中心性指数,在评价节点核心性时有其局限性。经常被用于评价的入度点度中心度 指标,其含义是其他节点对某一节点关系数量的总和,实际上就是该节点的总被引量。 接近中心度(closeness centrality)虽然是全局中心性指数,但其考虑的是节点在多大程度上不受其他节点的控制,也不适合作 为测度节点核心性的指标。如果分析节点信息传递的独立性或者有效性,可采用接近中心度。特征向量中心度(eigenvector centrality)是在网络总体结构基础上找到最居于核心的行动者,而不关注局部的模式结构,适宜 作为核心性指标。但是,特征向量中心度也有缺陷,当数据为有向数据时,利用该指标可能引起误导,因为有些位置的节点可能不被 选择。因此,如果分析不对称数据,需要先进行对称化处理。能够弥补这一缺陷的是核心―边缘结构分析中对于节点核心度(coreness)的测量。核心―边缘结构模型建立的基础就是关系的不 对称性,因此对于有向网络来说,采用核心度作为测量节点核心性的指标更加适宜。2.2 节点中介性测度除了测度节点影响力的核心性指标,从知识流通角度对节点进行测度的结构性指标,能为引文评价工作另辟蹊径。在引文网络中 处于不同位置的节点,对知识传播的作用是不同的,除了那些具有重大影响力的节点外,还有一些节点对知识的快速流动起到了重要 作用。而且,对于在不同研究领域的知识流通中起到枢纽作用的节点也应该在评价体系中有所体现,因为新的知识生长点往往存在于 研究领域或学科领域交汇之处。因此节点中介性测度能够弥补引文评价功能单一的缺陷。如果一个节点处于许多其他节点连通的最短路径上,就说明该节点具有较高的中介中心度(betweeness centrality)。中介中心度 是一种“控制能力”指数,即节点作为信息集散地的能力,可以很好地测度节点中介性。结构洞[17](structure holes)与中介中心度一样,也是围绕“局部依赖性”这个概念建立起来的。当两个点以距离 2 而不是距离 1 相连的时候,说明这两点之间存在一个结构洞。结构洞的存在使得连接两点的第三者扮演经纪人或者中间人的角色。拥有越低的结 构洞约束系数的节点,越具有获取多样化知识的能力,是潜在的创新节点。因此,中介中心度与结构洞约束系数都可以作为测度节点中介性的指标。不同之处在于,前者只能处理二值矩阵,后者可以处理 赋值矩阵,适用范围更广。总之,点度中心度、中介中心度和接近中心度的局限性在于它们没有考虑到节点之间信息交换的规模,因 而仅适用于对二值网络的测量。此外,媒介角色系数(brokerage roles)也可以作为赋值网络中评价节点中介性的指标。那些从自己所在的子群连接到别的子群的 节点,往往在整个网络中发挥重要作用,这类节点被称为“边界跨越者”。它们通常是具有创造性的节点,因为它们能够从不同的群 体中获得多方面的信息,综合不同的知识或思路形成新的创意。与结构洞约束系数的不同之处在于,它用于分析节点在子群内和子群 间所扮演的不同类型的中介角色。因此,如果是基于子群的分析,宜采用媒介角色系数,否则应采用结构洞约束系数。2.3 引文网络嵌套结构测度网络的嵌套结构与网络的等级结构不同,它揭示的不是权力层次结构,而是基于节点之间联系的紧密程度的层级关系,因此该方 法主要用于勘测科学或学科结构而不宜用于评价。嵌套结构的测度主要利用 k-核分析。k-核即成分(最大关联子图)中的点都至少与该成分中 k 个其他点邻接。一个简单的成分就是一个“1k-核”,如果忽略所有度数为 1 的点,就得到一个“2k-核”,依此类推,进而考察剩余各个点之间的关联结构。因此,一个 k-核便是在整个网络中的一个凝聚力相 对较高的区域。利用 k-核的一个明显好处在于对成分结构的研究可以运用度标准区分高低凝聚力的领域。这样,在进行引文分析时就 能方便探测出文献或作者的嵌套结构,过程中不仅可以分层展示,还可以根据需要选择不同 k-核进行分析。此外,n-派系、n-宗派、k-丛也可以用于嵌套结构分析。其中,k-丛与 k-核的机理一样,是基于子群内部成员之间关系频次的(点 的度数), n-派系和 n-宗派是基于子群成员之间可达性和直径基础上的。需要注意的是,n-派系和 n-宗派在应用方面有很大局限性。 而 首先 n-派系的直径有可能大于 n,其次 n-派系可能是一个不关联图。一个 n-派系中的两点可能通过一个长度不超过 n 的测地线连接在 一起,这条测地线可能包含外部的点,并且这两个点之间不存在一条仅仅包含 n-派系的成员的途径。n-宗派虽然限定了派系本身的直 径不超过 n,但是与 n-派系一样,当 n 大于 2 的时候,缺乏解释力。因此,一般来说,可运用 k-核分析来测度网络的嵌套结构。2.4 引文网络等级结构测度网络的等级结构分析一定是基于网络整体结构的,并且所有点和关系都应该被同时考虑,而不是把关注点仅限定在连接某些点的 特定路径上。核心―边缘结构分析、位置分析和角色分析符合这个要求。(1)核心―边缘结构分析核心―边缘模型(core-perphery model)的目的是对现实社会中表现出来的核心―边缘结构进行量化处理。在引文分析中可用该算 法分析期刊引文网络和作者引文网络,判断期刊或作者在“核心―半边缘―边缘”的层次结构中所处的位置,或者计算出每个节点的 “核心度”,再根据数据分布特征进行分层。其中各个节点在各层次中是可以流动的,但就整体而言,层次结构是相对稳定的。运用 该模型时需要注意,只有单一核心网络才适用此方法。因此提出以下建议:可以先利用派系分析、聚类等方法考察现实网络是否存在 多个核心。有的网络可能拥有较多核心,而利用核心―边缘模型分析的时候,可能找不到这些核心。(2)位置分析与角色分析社会网络分析中的“位置”(positions)和“角色”(roles)概念是比较抽象的,它们不同于中心度、派系等具有现实基础的概念, 但也正因为如此,位置分析和角色分析能够对引用行为和网络结构进行一般化分析,得到具有推广意义的结论。更重要的是,我们可 以在引文分析中运用此方法,根据类似的引用行为将各知识节点归类,并且解释是什么因素使这一类节点不同于其他类别的节点。“网络位置”指的是一系列在网络关系或者互动中相似的节点。由于位置概念基于节点子集之间的关系相似性,因此,这个概念 与凝聚子群的概念截然不同,处于相同位置的节点之间不必然有直接或者间接的关系。根据分析网络位置的结构对等性原理和对图书 情报学期刊的实证研究结果[18],在引文分析中,网络位置分析从两个维度对引文网络中的节点进行了区分。第一个维度是学科相似 性,它把研究领域相近的文献、作者,学科领域相近的期刊分在了一组;第二个维度是节点权威性,将与其他节点引用关系相似的节 点分为了一组。因此,如果对节点的学科分布情况比较熟悉,可运用位置分析同时察看各个节点学科分群和权威性两个方面的情况。 角色分析基于“规则对等性”原理,要比“结构对等性”更抽象一些,它不像结构对等性那样要求节点跟其他节点具有相同的关 系,只是要求占有相同位置的节点以相同的方式相关联,即关注的是关系之间的联系。在引文分析中就是对位置分析中第二个维度的 专门测度。因此,引文网络中的各种角色就可以根据一系列引用与被引用关系之间的联系来定义。角色分析可以不受节点学科属性的 干扰而仅仅考察节点之间的权威结构。2.5 引文网络分群测度网络分群方法有两大类:一类是基于关系属性的凝聚子群分析(cohesive subgroup analysis),即群落结构测度;另一类是基于 结构对等性的位置分析。前者比较具体,包含众多算法,后者比较抽象,但是如果研究者对某领域的期刊、作者等知识节点比较熟悉 的话,位置分析可以从整体网络的角度为学科分类提供依据,而且在有向赋值网络中比凝聚子群分析更具优势。位置分析前面已有介 绍,以下具体谈凝聚子群分析。凝聚子群分析对于期刊、作者、文献的分群,学科结构的研究都是一种精细的工具,它描述如何根据一定的模式把网络中的节点 分派到各个子群之中。但是由于分析凝聚子群的算法很多,又是基于对关系的不同限定,彼此之间既有联系又有区别,因此有必要根 据引文网络的特点和引文分析的目的厘清各种凝聚子群算法的适用情况,总结出具有可操作性的凝聚子群分析的一般方法和步骤。 “凝聚子群”在网络研究中并不是一个具有明确含义的概念。大体上说,“凝聚子群是这样一些节点的子集,子集中的节点之间 具有相对较强的、直接的、紧密的、经常的或者积极地联系”[19]。成分、派系、n-派系、n-宗派、派别、k-丛、k-核等都属于“凝 聚子群”的范畴,都可以看成是“凝聚子群分析”的各个类型。它们分别是基于关系的互惠性、可达性、度数或子群内外关系来判定 的。对于不同的算法在分析子群时有不同的处理方式,其中两个常规方法如下:(1)对于派系严格的子群来说,很可能在网络中出现派系重叠的情况,即子群间存在一个或多个共同的节点,因此一般将一个包含 重叠关系的派系群当做一个凝聚子群(如社会圈),而不是将每个单独的派系分别列为子群。(2)k-核分析将形成一个嵌套(nested)结构,高一阶的 k-核总是包含低一阶的 k-核,所以一个节点可能同时属于几个 k-核。不同 成分中的 k-核节点之间也不相连。 因此, 为了得到凝聚子群, 研究者需要删除 k-核中的低阶节点, 直到网络分为几个相对紧凑的成分。将 Wouter de nooy 等人[20]制定的凝聚子群分析决策树稍作修订,绘制凝聚子群分析流程图(见图 1)。 图 1 凝聚子群分析流程 至于选择哪种技术来分析凝聚子群,主要依赖于网络的密度。在密集网络中,重叠派系可以很好地揭示网络的基干构架;而成分 和 k-核分析更适合拆分疏松的网络。建议在最初试探性的研究中,先进行成分分析再运用 k-核分析,如果 k-核过大,有必要进一步 细分,再查找其中的派系、重叠派系或完备三方组。也有的研究者[21]认为,在分析凝聚子群时,应该先分析定义比较严格的子群, 然后分析界定比较松散的子群。例如,可以先分析“派系”,如果不存在派系,再进一步分析 n-派系等。但本文认为,采用由松散到 严格的分析路径能更好地把握引文网络的总体结构,同时不会遗漏网络的细部结构,并且容易判断采用的算法和设定的阈值是否合适。 对应图 1,将凝聚子群分析的一般过程总结如下:(1)如果数据是二值的,直接看第一步;如果数据是赋值的,需要进行二值化处理。一般可采用平均同引强度、平均被引率等均值 或网络密度作为阈值。以相似性数据(数字越大表示关系越近)为例,要确保大于某个指定值的数字重新编码为“1”,否则为“0”。 也可以设置不同的阈值进行分析,以便检验数据的稳健性,找出隐含在数据中的比较完备的图形结构。(2)如果数据是无向的,进行 a 组分析;如果数据是有向的,进行 b 组分析。对于无向网络,分析其成分;对于有向网络,先分析 其弱连接成分,如果在弱连接成分中没有找到子群,再分析其强连接成分。成分分析是凝聚子群分析的最简单形式,并且有时候成分 可以为我们提供用来回答问题的充分信息。如果情况确实如此,分析就到此结束。 (3)如果成分分析的结果没有为我们提供充分的信息,则对无向网络进行 k-核分析。如果能够获得比较清晰的嵌套结构,则提高 k-核阈值,去除低阶 k-核中的节点,将简化后网络的成分作为凝聚子群,结束分析流程。如果经过 k-核分析还是没有找到子群,则在 网络中寻找派系或重叠派系。如果寻找失败,则网络中不存在凝聚子群,结束分析流程。如果寻找成功,则进行成分分析,获得凝聚 子群,结束分析流程。(4)对于有向网络,如果强连接成分分析未能得到凝聚子群,则寻找派系或重叠派系。如果寻找成功,则相继步骤与 5a 相同。如 果未找到则需要对称化网络,将所有的单向连接转换成双向或无向连接,之后利用得到的对称矩阵进行 k-核分析,相继步骤与 3a 相 同。(5)如果在 4b 和 5a 中没有或仅找到几个派系,可以尝试作如下调整:如果派系的规模最小值为 4 或者更多,可以降低规模,但是 不能降低到 3 以下;如果数据经过了二值化处理,则对于相似性数据来说,需要降低阈值,对于相异性数据来说,需要提高阈值。如 果分析的结果是找到了太多的重叠派系,有必要的话可以把上述两个步骤颠倒过来进行,即增加派系的最低规模,最终就是改变阈值。另外,在流程图中没有提及分派分析(factions),它与派系分析不同的是可以找出指定数目的派别。只要知道可以分为几个区, 针对网络中的任何一个成分都可以进行分派分析。比如在 2a、2b、3b、4b、5b 的分析中如果能推演出网络中大体存在多少个分组,就 可以直接进行分派分析;又如在已经分析出的凝聚子群中,如果知道或者需要分为多少个小派别,也可以进行分派分析,找出子群内 部的子-子群,这就需要结合具体的关系网络进行勘测。2.6 引文网络演化测度复杂性研究与社会网络研究的结合,为知识传播网络的演化问题开启了一扇窗。引文网络的生成和演化可以利用已有的网络拓扑 基本模型来描述,而引文时序网络的演化路径可以通过关键路径分析得以呈现。(1)BA 无标度模型与适应度模型无标度是复杂网络的一个重要特性,文献计量学的三大定律即洛特卡定律、齐普夫定律和布拉德福定律在数学形式上都呈幂律分 布,具有标度变换下的不变性。国内外的大量研究也已经证明引文网络同样具有无标度特性,是无标度网络。与小世界网络是要建立 一个具有明确拓扑特性的图不同,无标度网络的建模目标把重点放在掌握模型的动态特性上。其中 BA 无标度网络模型和适应度模型很 适合用来对引文网络进行动态分析。 BA 模型考虑了网络的增长特性和优先连接特性,这两点符合引文网络的形成过程。引文网络的规模是在不断扩大的,每个月都会 有大量新的科研论文发表,而且新发表的文章更倾向于引用一些已被广泛引用的重要文献。适应度模型与 BA 模型的区别在于,在适应 度模型中的优先连接概率与节点的度和适应度之积成正比,而不是仅与节点的度成正比[22]。这样,如果一个年轻的节点具有较高的 适应度(与节点的内在性质相关),那么该节点就有可能在随后的网络演化过程中获取更多的连接。这一模型算法符合许多实际网络, 在引文网络中表现为一些高质量的科研论文在较短时间内就可以获得大量引用的情况。无论是 BA 无标度网络模型还是适应度模型,既能增减节点,又能重布连线,适合描述引文网络的生成和演化。表 1 总结了引文网 络无标度特性的形成机制。正是节点的增长性和连接的择优性使得引文网络呈现无标度幂律分布。 (2)关键路径搜索算法在生物范畴,遗传基因蕴含着生命体的延续与演进关系,而在科学研究领域,参考文献标识了学术传承与发展的轨迹。引文时序 网络最详细地记载了科学研究的这种传承关系。加菲尔德的引文编年可视化系统 HistCite[23]就是展现引文时序网络的一种方式,但 是该系统缺少更为细致的定量模型,“对于文献之间引用关系的密切程度无法反映”[24],不能对关键文献及科研发展路径作出精确 描述。而由哈蒙[25]及其同事提出的关键路径搜索算法(main path analysis)弥补了这一缺陷,其独特之处正是在于关注了引文时序 网络的形成过程。把引文网络看作一个传输知识信息的通道系统,其中如果有一篇高被引论文不但承继了很多以往的研究成果,并且还增添了实质 性的新知识,那么它或多或少会降低先前一些论文的参考价值。因此,这篇文献就成为了承载着大量知识流的通道枢纽。可想而知, 有很多引用路径都需要经过的文献节点一定比只有很少引用路径经过的文献节点更加重要。那些最重要的参考文献及其引用关系就构 成了一条或多条关键路径,勾勒出科学发展的框架图。关键路径搜索算法计算的就是每一个特定引用路径或文献在连通其他文献的引 用路径时被需要的程度。这种测度指标被称作一篇文献或一条引用路径的“传输权重”。提取出拥有高传输权重的路径作为关键路径 (main path)或者关键路径成分(main path component),它们即是传递文献知识流的“主干道”,可以通过分析其演进过程了解学术 研究融合与分裂的模式,以及学术共同体的形成。 为了便于查看,表 2 总结了对应于不同的分析目的,网络分析方法的选择及适用情况。 3 引文分析中网络分析方法与统计分析方法的结合 从方法论角度来说,网络分析方法的整体主义(holism)方法论补充了一般统计分析的个体主义方法论(methodological individualism)。所谓个体主义方法论是把个体视为独立单位,按照个体的内在属性和规范特征来解释个体行动的一种研究范式。而 网络分析者从关系而非范畴的角度界定总体和样本,从相互联系而非孤立的视角描述和分析资料。体现在具体方法上,就是“网络分 析者特别是整体网络分析者较多地运用行列式的数学方法,而较少地运用个体主义的统计技术”[26]。国外学者对于网络分析在方法 论上的优越性已经进行了很多讨论。例如 Emirbayer[27]认为,网络理论把解释建立在关系模型之上,从关系视角进行的解释优于从 个体属性视角作出的解释。Wellman[28]提出,网络分析方法直接针对社会结构的模式化的关系本质,从而可以补充甚至超越主流的统 计方法。笔者认为,研究范式的转变是大势所趋,引文分析应该基于引文网络结构而不仅仅是引文条目,但是基于实体论的个体主义 方法也是同样重要的,不能一概抛弃。比如网络分析方法和多元统计方法在分析结果上就可以互为印证和补充。有时候仅仅从网络关 系的角度,或仅仅从个体属性的角度给出的解释都是不充分的,将两种不同视角的分析方法结合起来进行引文分析,能够更好地理解 知识传播现象。具体来说,在引文分析中,网络分析方法与统计分析方法至少可在以下方面结合使用。(1)鉴于因子分析的精确性和网络分析的解释力及可视化优势,可将因子分析与位置分析、角色分析等网络分析方法相结合,对网 络分群或网络结构作出全面、精确的判定,之后再运用网络分析软件将结果可视化。 (2)对于小样本的研究,或者经过缩减数据不会导致信息大量流失的样本,可以直接采用多元统计分析方法,因为以“地图”形式 显示的知识节点更符合人们的认知习惯。对于大型引文网络,也可以先运用网络分析简化网络,然后再运用多元统计方法进行分析和 显示。(3)在网络分析中,可先运用一般统计方法了解引文网络的基本静态特征,或运用多元统计分析检测研究对象是否符合某种网络分 析方法的适用前提。例如,可以用聚类分析检验引文网络是否为单一核心以及初步了解核心、亚核心的分布情况。4 结语总的来说,网络分析方法在引文分析中的整合,可以利用复杂网络理论研究引文网络的整体结构特性,探讨网络结构的形成机制 和演化过程;利用社会网络分析法分析引文网络的细分结构以及结构与个体间的相互作用;同时运用各种网络分析软件,如 Pajek、 KNOT、UCINET 等展示基于节点间关系的引文网络结构,加强引文分析过程和结果的可视化。实际上,网络分析方法是图论结合代数方法、概率统计等发展起来的,它从来不排斥其他数学方法的运用。尤其是通过近年来的 迅速发展,网络分析方法已经涉及了一些较为复杂的数理分析和高级统计方法。本文论述中之所以形成网络分析方法与统计分析方法 对立的局面,是基于网络理论和引文分析各自发展历史的,也是为了达到论述清晰的目的。笔者认为,在引文分析中要考虑的不是分 析方法的替换,而是在方法论的层面挖掘网络分析的优势,将其更好地融入到当前的引文分析研究中。另外需要强调的是,网络分析 不仅是对关系或结构加以分析的一套技术,它还是一种理论方法,是一种结构分析观点。我们不仅要了解网络分析的具体方法,还要 理解其基本原理,从而更好地加以应用。【参考文献】[1]Watts D J, Dodds P S, Newman M E J. Identity and search in social networks[J]. Science, 71): .[2]刘则渊,陈悦,侯海燕,等.科学知识图谱:方法与应用[M].北京:人民出版社,.[3]陆伟,李纲,谢阳群,等.面向创新型国家建设的知识组织与服务――中国科协第 150 次青年科学家论坛会议综述[J].图书情 报知识,2008(3):101-104.[4]岳洪江.管理科学知识扩散网络的结构研究[J].科学学研究,2008(4):779-786. [5]韩毅,张克菊,金碧辉.引文网络分析的方法整合研究进展[J].中国图书馆学报,2010(4):83-89.[6]Gattrell A C. Describing the structure of a research literature: Spatial diffusion modeling in geography[J]. Environment and Planning, 1984B: 11.[7]Hummon N P, Doreian P. Connectivity in a citation network: The development of DNA theory[J]. Social Networks, 1989(11): 39-63.[8]White H D. Pathfinder networks and author co-citation analysis: A re-mapping of paradigmatic information scientists[J]. Journal of the American Society for Information Science and Technology, ): 423-434.[9]Leydesdorff L. Clusters and maps of science journals based on bi-connected graphs in the journal citation reports[J]. Journal of Documentation, ):371-427. [10]Leydesdorff L. The delineation of nanoscience and nanotechnology in terms of journals and patents: A most recent update[J]. Scientometrics, ):159-167.[11]Leydesdorff L, Ismael Rafols. A global map of science based on the ISI subject categories[J]. Journal of the American Society for Information Science and Technology, ):348-362.[12]金碧辉, Loet Leydesdorff, 孙海荣, 等.中国科技期刊引文网络: 国际影响和国内影响分析[J].中国科技期刊研究, 2005(2): 141-146.[13]仲艳秋,张晗,冷荣新,等.利用社会网络分析法和聚类法研究心血管疾病知识结构的比较[J].中华医学图书情报杂志, 2007(6):77-80.[14]徐媛媛,朱庆华.社会网络分析法在引文分析中的实证研究[J].情报理论与实践,2008(2):184-188.[15]岳洪江,刘思峰.管理科学期刊同被引网络结构分析[J].情报学报,2008(3):400-406. [16]陶乃航,赵星,彭晓东,等.中心度指标在期刊引文网络分析中的运用及改进[J].图书情报工作,2009(14):143-146.[17]Burt R S. Structural holes: The social structure of competition[M]. Cambridge, MA: Harvard University Press, 1992.[18]宋歌,叶继元.基于 SNA 的图书情报学期刊互引网络结构分析[J].中国图书馆学报,2009(3):33-41.[19]Wasserman S, Faust K. Social network analysis: Methods and applications[M]. Cambridge: Cambridge University Press, .[20]De Nooy W, Mrvar A, Batagelj V. Exploratory network analysis with Pajek[M]. New York: Cambridge University Press, 2005:78.[21]刘军.社会网络分析导论[M].北京:社会科学文献出版社,3. [22]汪小帆,李翔,陈关荣.复杂网络理论及其应用[M].北京:清华大学出版社,2006:34.[23]Garfield E, Pudovkin A I, Istomin V S. Algorithmic citation-linked historiography-mapping the literature of science[C]. Proceedings of the American Society for Information Science and Technology, Annual Meeting, November 2002, Philadelphia, .[24]李运景.基于引文分析可视化的知识图谱构建研究[M].南京:东南大学出版社,2009:43.[25]Hummon N P, Doreian P. Connectivity in a citation network: The development of DNA theory[J]. Social Networks, 1989(11): 39-63.[26]张文宏.社会网络分析的范式特征――兼论网络结构观与地位结构观的联系和区别[J].江海学刊,2007(5):100-106.[27]Emirbayer M, Goodwin J. Network analysis, culture, and problem of agency[J]. American Journal of Sociology, 1994(99): . [28]Wellman B, Berkowitz S D. Social structures: A network approach[M]. Cambridge University Press, .

我要回帖

更多关于 近代中国社会性质是 的文章

 

随机推荐