信息计量学复习整理

信息计量学复习整理

一、 信息计量学的由来与发展

1.

2.

3.

4.

5.

6.

7. 每年发表的文献量增长较快,并逐步形成了本学科的核心情报源 确立并提高了学科的地位 主要分支领域的研究取得重要成果 文献计量工具和手段的现代化取得重要进展 专业教育起步快、发展迅速 形成一支骨干队伍(核心研究队伍已基本形成) 国际交流与合作发展势头良好 二、 信息计量学的概念和内容体系

概念:采用定量方法(数学、统计学等)来描述和研究情报(信息)的现象、过程和规律的一门学科。广义信息计量学——以广义信息论为基础(作为世界三个基本要素之一的信息)的信息计量;狭义信息计量学——研究情报信息(或文献情报)的计量问题。 三、 信息计量学与相关学科(论述)

第一层——母体学科:图书馆学、文献学、情报学

第二层——工具性学科:数学、统计学、文献计量学、科学计量学

第三层——相似性学科:计算机科学、科学学、预测学、科技管理学、科学评价学

1. 信息计量学与数学和统计学

信息计量学是数学方法应用于信息情报研究领域相结合而形成和发展起来的。信息计量学研究的最显著特征是定量分析,而数学正是定量分析的最强有力的工具。数学方法的应用程度成为信息计量学发展水平的重要标志。

2. 信息计量学与文献计量学

从研究内容上来看,许多共同的研究内容,又有不尽相同的地方

从世界层次来看,文献计量学对应“世界I ”——客观物理世界,信息计量学则属于“世界III ”——客观知识世界。

从信息的层次来看,信息计量的范围包括“零次信息”的概念,但毫无疑问,文献信息时整个科学情报的主体。

从任务和方法上来看,信息计量学研究的任务更艰巨,更难找到恰当的定量方法及途径。

3. 信息计量学与科学计量学

科学计量学——用定量方法研究科学学的一门学科,或者说,用以研究科学发展过程的各种定量方法的总和。

从研究目的来看,科学计量学从定量的角度来探讨科学发展的内在规律,信息计量学一是探明科学文献本身的规律,以提高信息管理的科学性,二是通过信息规律的讨论进而揭示科学技术的规律性。

从研究对象和方法来看,极为类似。

信息计量学的范围比科学计量学范围广很多。

服务信息科学的研究需求 vs. 研究并验证科学的产生、传播和利用的量的规律性

4. 信息计量学与网络信息计量学

网络信息计量学是信息计量学的一个新的发展方向和重要的研究领域。继承与发

展的关系。

5. 信息计量学与科学评价学

广义的科学评价:用科学的方法进行评价——评价的科学化。

信息计量学的理论原理和方法技术都被广范应用于定量科学评价中。 四、 文献信息流的特征

静态特征:在一定时间内科学文献在空间的分布性质,如集中-离散分布、按著者分布、词汇在文献中分布、引文分布、主题相关分布等的规律性。

动态特征:科学文献随时间的延续而增长和老化的性质。既增长又老化。 五、 文献增长的指数增长规律

一般以文献累计数据为依据

正常的、日益增长的科学领域内的文献是按指数增加的。

F (t )=a·e^(bt )

t ——时间,以年为单位

a ——条件常数,即统计的初始时刻(t=0)的文献量

e ——自然对数的底

b ——时间常数,即持续增长率:某一年的累计增加量与前一年文献累计总数的比重。 六、 文献老化的概念

1.

2.

3.

4. 过程观:历时观察 状态观:共时观察 过程状态辩证观:过程是状态连续变化的过程,状态是某一时刻过程的状态。 老化的不是科学情报本身,而是包含这些情报的文章(文献老化速度快,情报老化速度较慢)情报老化相对于情报对象(客观存在的物体、事实、现象及其性质和特征等)而言,文献老化相对于情报用户(利用情报的人)而言。

5. 表现:文献包含的信息失效;文献被替代;文献知识成为常识;文献内容不再是研究热点。 七、 文献老化的指标

1. 半衰期(中值引文年限)、

历时半衰期:已发表的文献情报中有一半已不再使用的时间。

共时半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长的一段时间内发表的。

2. 普赖斯指数

Pr = 出版年限不超过5年的被引文献数量 / 被引文献总量 * 100%

普赖斯指数越大半衰期越短,只适用于文献情报。

3. 剩余有益性指标

某一年份某一期刊被用户所利用的文献数称为期刊有益性。经过若干年后,期刊还保留的有益性——即剩余有益性。

4. 老化系数

负指数变化,与半衰期成正比。 八、 文献信息集中与离散分布规律——布拉德福定律

1. 区域描述:如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个区,使每一个区所包含的相关论文数量相等,三个区中的期刊数量成n1:n2:n3 = 1:a :a^2的关系。

a ——布拉德福常数,或称比例系数

2. 图像描述:n1:n1-2:n1-3 = 1:b :b^2

n1-2 = n1+n2

n1-3 = n1+n2+n3

b ——分散系数

3. 一个定律,十来个经验公式,四个数学模型 九、 齐普夫定律的理论基础——最省力法则

每一个人的运动都在一定的途径上进行,而且都将收一个简单的基本法则的制约,千方百计的选择一条最省力的途径。

从经济上、安全上、时间上,并结合本人主观条件及客观条件等种种因素考虑,想方设法地选择一个最符合自己条件和要求的方法或途径,使自己付出的“力”最小。

最小的“力”最少。(利益最大化——理性人假设) 十、 文献信息词频分布规律——齐普夫定律

把一篇较长的文章(约5000)中每个词出现的频次统计起来,按照高频词在前,低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,Fr 表示频次,r 表示等级序号,则Fr ·r = C。

fr 表示频率,fr ·r = c 。

取对数,直线图像描述。b ·lg r + lg Fr = lg C 十一、 文献信息作者分布规律——洛特卡定律

生产n 篇文章的作者书是生产1篇文章作者的1/n^2左右,生产1篇文章的作者是全体作者的60%左右。

y (x ) = y(1) / x^2

广义洛特卡定律:f (x ) = C / x^n , x = 1,2,3,···Xmax (一定时期内作者撰文的最大能力) 十二、 文献信息统计原则

1.

2.

3.

4.

5. 针对性 准确性(核心要求) 代表性 可比性 累积性 十三、 确定统计指标的原则

上述五条

6. 指标概念明确

7. 计算方法简便

8. 单位明确 十四、 文献信息统计的基本步骤

1. 统计调查

(1) 确定具体方法

(2) 选准统计工具

(3) 明确指标项目

2. 统计整理

(1) 计算

(2) 排序

(3) 表示

3. 统计分析

(1) 理论指导下的分析

(2) 数值分析

(3) 图像(函数值、斜率)分析 十五、 引文分析法基本概念

利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。 十六、 引文分析法的步骤

1.

2.

3.

4. 选取统计对象 统计引文数据 引文分析 作出结论 十七、 SCIE 的结构、功能、特征

1. 结构

(1) 概括性的总体介绍

(2) 引文索引

1) 作者引文索引

2) 团体作者引文索引

3) 匿名作者引文索引

4) 专利引文索引

(3) 团体索引

1) 地区部分

2) 机构部分

(4) 来源索引

(5) 轮排主题索引

2. 功能

(1) 简易检索

(2) 全面检索

1) 一般检索

A. 主题检索途径

B. 著者检索途径

C. 来源期刊名检索途径

D. 著者地址检索途径

2) 被引文献检索

A. 被引著者检索

B. 被引著作检索

C. 引文年代检索

3) 结构检索

4) 高级检索

3. 特征

(1)

(2)

(3)

(4)

(5) 十八、 ESI 的结构、功能、特征

1. 结构

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

(11)

(12)

(13)

2. 功能

(1) 特色链接(内部/外部) 浏览器界面,超文本格式 每周更新 检索整个数据库与指定检索年份 直接收录纯电子期刊 科学家排名 机构排名 国家排名 期刊排名 高被引论文 热门论文 基线(篇均被引频次,百分点) 研究前沿 顶尖论文 图表界面(5年一时间段的论文数/引用频次/篇均被引频次) 引证信息 特殊话题 《科学观察》 检索功能

1) 引文排序(By field / By name)

2) 高被引论文的检索(By field / By searching)

3) 研究前沿

4) 检索规则

评价功能

基本的分析工具

服务对象的广泛深入

综合全面的数据、论文和课题

与其他信息资源的连接与整合 (2) 3. 特点 (1) (2) (3) (4) 十九、 引文分布规律

1. 影响因子

相对数指标,主要用以调整和修正大刊、老刊凭借发表论文绝对数量而在期刊被引上所占的优势,同时选择期刊被引数量达到最高峰时来计算其平均被引率,所以更能反映期刊被使用的真实情况。

影响因子 = 某刊前两年发表论文在概念的被引证次数 / 该刊前两年发表论文总数

2. 即年指标

测度期刊被引用速度的指标,表征期刊的“即时反应速率”。

即年指标 = 该刊某年发表的论文在当年的被引次数 / 当年发表论文的篇数 二十、 引文耦合与同被引

1. 文献耦合:A 和B 两篇文献共同引证了一篇或多篇参考文献,或者说他们共同具有一篇或多篇同样的参考文献,则称A 和B 两篇文献具有引文上的耦合关系。(耦合强度n )

2. 同被引:两篇(或多篇)论文同事被后来的一篇或多篇论文引证,则称这两篇论文(被引证论文)具有“同被引”关系。(同被引强度=同被引频率)

3. 异同

(1) 引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被

引证文献之间的关系。

(2) 引文耦合强度是固定不变的,同被引强度则随时有可能发生变化。

(3) 引文耦合反映的是文献间的关系是一种固定的长久的关系,而同被引

反映的则是变化或暂时的关系。

(4) 引文耦合属于“回向引证”,而同被引属于“前向引证”。

(5) 对动态结构来说,“同被引”比“引文耦合”更具有优越性 二十一、 引文分析法的局限性

(1)

(2)

(3)

(4) 二十二、 核心期刊的概念 文献被引证并不完全等于重要 著者选用引文受到可获得性的影响 引文关系上假联系的影响 马太效应的影响

针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊(学科核心期刊&馆藏核心期刊)。 二十三、 测定核心期刊的意义

1. 图书情报单位科学管理上的需要

2. 科技工作者重点阅读的需要

3. 提高信息检索和文献信息服务效率的需要 二十四、 核心期刊的测量方法

1. 利用信息计量学工具和指标直接选定各学科的核心期刊(SCI ,JCR )

2. 利用文献计量学方法,按照一定的基本步骤来测定

(1) 以载文量为标准的方法包括布氏定律法及百分比补偿和累计百分比法

(2) 以摘引率为标准的方法,包括文摘发和尹文发

(3) 以流通量为标准的方法

(4) 综合评价法 二十五、 研究科学发展特点

1.

2.

3.

4.

5.

6. 科学发展速度加快 科学发展具有继承性 科学发展具有阶段性 学科间具有交叉渗透性 科学发展重点的转移 科学劳动的集体性 二十六、 研究科学发展结构

1. 利用书目(篇目)分析法研究科学结构(学科结构,学科动态发展特征)

2. 利用引文分析法研究科学结构(静态、动态、超结构的微观研究)

3. 利用词频分析法研究学科发展结构

二十七、 研究科技史

每一篇论文都是科学发展过程中特定事件的记录,每个历史事件都是在不同的时间点上发生的。 二十八、 研究科技政策

科学家的分布、科学生产率的测定为科技政策的制定提供依据 二十九、 信息计量学评价人才的原理

三十、 信息计量学评价人才的内容

1. 评选杰出科学家

2. 预测未来获奖者 1. 科技人员的成就和学术造诣预期发表的文献数量有关 2. 科技人员的成就和学术造诣与其发表文献的被引次数有关 三十一、 信息计量学评价人才的方法

1. 书目(篇目)分析法

2. 引文分析法 三十二、 网络信息计量学的概念

采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互印证和开发利用等进行定量描述和统计分析,以解释其数量特征和内在规律的一门新兴分支学科 三十三、 网络信息计量学的主要特征

1.

2.

3.

4.

5.

6.

7. 计量方便 统计全面 结果准确 学科新颖 方法净值 应用广泛 更新较快


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn