0

    高等教育数字化发展研究 | 张凌燕 张焕明 汤颖颐:基于网络计量学的高校英文网站

    2023.05.24 | admin | 208次围观

    (二)评价指标

    确定核心网站的评价指标。评价一个高校英文网站的整体建设情况,需要将核心网站和二级网站共同组成一个英文网站集群进行综合分析。这个网站集群的核心网站是这个学校的官方英文网站。

    1.核心网站内容指标

    确定导航栏目设计和首页展示栏目数、文章数。一个网站的诞生都是从栏目设计规划开始,栏目数量和填充的内容是关乎网站吸引度的灵魂。英文网站通过新闻稿件质量(Events)、科研稿件更新频率(Research)、科研机构(Institute)、招生计划(Admission)、师资介绍(Faculy)展示一个高校国际化视角下的综合实力和科研水平。

    核心网站页面设计风格是定性分析的内容,和评价人的主观感受有关。布局的整体性、分割性、色彩搭配等视觉元素运用得别具一格,符合人类审美的基本原则,往往第一眼就能给访问者以震撼的力量。

    确定核心网站的网页数、外部链接数、网络影响因子。网页数是网站架构层次分布和内容规模大小指标,网页数越多证明英文网站内容越丰富。外部链接数是外部网站或页面指向该网站的超级链接数量,可以包括文本、图片等格式的链接。外部链接数能反映网站被收录的频次、被关注度、网络影响力。大多数学者选取2006年挪威·阿里雷扎(Noruzi Alireza)根据彼得·英沃森(Peter Ingwerson)提出的WIF公式,修正后的算法为:WIF=外部链接数/搜索引擎搜索到的网站内网页总数[4]。

    2.具有特定指向性的标志性指标

    核心网站仅是一个权重最高的指标,评价一个高校英文网站的整体建设水平还应选取其它几个维度指标。一是图书馆(Library)有无建设英文网站。建设英文版的数字图书资源库能为留学生开展学术科研提供有力支撑。二是从学校层面统筹建设以独立域名***.edu.cn为标志的英文版教师主页系统。三是英文版新闻网(News)。几乎所有高校都建有官方中文新闻网站,有无建设以独立域名为标志的英文版新闻网,是反映一个高校教学、科研、文化、活动的独树一帜的指标。四是二级学院英文网站建设指标。该二级网站不以首页域名下的超文本标记语言(Hyper Text Mark-up Language,简称HTML)页面学院介绍为评价指标,而是选取以独立域名为标志的二级学院英文网站为指标。Schools网站建设数量的多少反映高校对英文网站顶层设计和纵深发展的统筹规划建设的程度。

    (三)研究方法及工具

    被网络计量学研究学者普遍使用的几大商业搜索引擎AllTheWeb、Google等均存在误差,对此,有学者在《搜索引擎在网络链接分析中的应用研究》中进行了详细研究。[4-6][8][9] AllTheWeb于2011年4月被关闭停用,通过几大搜索引擎和站长之家()的SEO查询已经无法直接查询网页数。百度的Domain指令,查询出来的是网站相关域名结果,包含互联网上含有网站URL链接以及网页内容中存在URL字符串的所有页面。只要被搜索引擎收录都有可能当成反链数搜索出来。实际上Domain搜索结果的数量要比网站反链数多很多。

    Google查询网站反向链接的最精准的办法就是使用Google的网站管理员工具,但Google网站管理员工具只能查到具有控制权的网站。在站长之家的外链查询的官方网站()上显示:该工具用于反链查询(外链查询),可以查看该网站被哪些网站链接。综合比较后选取站长之家的外链查询作为数据采集工具。

    三、数据获取和分析

    (一)数据获取

    大数据分析常用数据采集的方法是使用Phython的Beautifulsoup4库自定义程序爬取样本网站数据。将样本网站的核心网站当成种子结点网站死链接查询工具,从种子结点URL开始,按深度优先的策略分别遍历标签对象、字符对象、HTML对象、注释对象。经过递归遍历产生外部超链接队列,接下来对外部超链接队列进行第一次遍历过滤。设定将域名解析成以edu.cn结尾的URL为目标二级网站;域名解析成非edu.cn结尾的URL为友情外部链接。一方面,一次过滤后的结果就是该样本网站链接的所有二级网站。因爬虫的合法性仍存在争议,为规避对样本网站正常运行的影响、保护数据安全,未采用爬虫库实施样本网站的爬取。另一方面,一次过滤分析后的二级网站包含Admission、Research、Laboratory等栏目下的超链接,超链接跳转的网站有中文网站、英文网站,还需要通过访问进行二次过滤分析,对每个链接进行点击确认是否连接访问有效、是否为英文网站,以及是否重复,研究在2021年6-7月这个时间段内的点击访问样本网站地址,并进行统计分析。最后得到的数据如表2所示。

    表2 样本网站特定指向性评价指标(统计时间为2021年6-7月)

    双一流大学A类共36所高校,除中央民族大学没有建英文官方网站,其余35所均建设有英文官方网站。从表2中看出,各高校英文官方网站(核心网站)上链接的二级英文网站以独立二级域名算,不含Schools和Departments,建设单位主要是各高校管理部处和职能部门,核心网站上链接二级英文网站较多的是武汉大学(31)、厦门大学(20)、北京大学(17)。仅有5所高校核心网站上链接的二级英文网站≥10,这在所有样本网站上占比约为13%,其它均≤10。

    二级学院Schools(不含Departments)建设较多的是山东大学、浙江大学、吉林大学,不少高校Departments也建设有英文网站,在此没做统计,只统计二级学院层面的数据。同济大学的Schools有24个英文网站,但没有在核心网站上进行链接。湖南大学的Schools也有6个英文网站,但也没有在核心网站上进行链接。链接二级Schools较多的有8所高校,其二级Schools英文网站≥30,占比约为21%;链接二级Schools较少的有11所高校,其二级Schools英文网站≤10,占比约为29%;其余近50%的高校Schools链接数量在10~30之间。

    教师主页是教师个人学术成果、招生意向的展示窗口。在学校层面统一规划建设英文教师主页的有北京大学、复旦大学等6所高校,其余高校仅部分学院在学院英文网站上有教师主页的展示。

    建设图书馆英文网站的有北京大学、清华大学等18所高校,近半数样本网站针对留学生建设有英文版的图书数字学术服务项目。

    以独立二级域名算,全国建设英文版新闻网的仅有北京大学(newsen.pku.edu.cn),其它高校均是在英文网站上以News、Events、Research等栏目内容的形式呈现新闻活动类文章,这是北京大学官方英文网站文章数量少的原因。新闻网独立运营一个英文版,也彰显出北京大学英文报道独树一帜的硬实力。

    (二)搜索引擎SEO查询数据获取及分析

    从表3中看出,各网站网页数差异较为明显,中山大学(4686)、上海交通大学(3367)、清华大学(3001)的栏目文章内容页数量相对较多,排列在网页数的前三名。网页数主要来自栏目文章内容详情页,主要分布于News、Events、Research这三个栏目,以上三个高校的这几个栏目均有历年的文章数据沉淀,总文章数超过其余高校(北京大学除外)文章数的3~4倍。因网站首页导航(About、Admission、Campus Life等)层次和内容建设一般属于静态栏目,网页数和网站导航栏目层次内容关系不大。而News、Events、Research属于动态栏目,文章数量是网站网页数的主要影响因子,文章数量多表示栏目更新维护频次高。北京大学是38个样本里唯一独立建设有英文版新闻网的高校(以独立域名指向算),News、Events栏目均呈现在英文版新闻网,其英文官方网站的网页数较其它高校低。网页数多的高校对学校的新闻、活动事件的英文报道频繁,内容维护力量强。

    表3 SEO查询数据统计(搜索时间为2021年7月29日)

    站长之家不支持子目录的反向链接查询,清华大学、中国人民大学、天津大学、复旦大学等9个英文网站的地址,是作为子目录放在学校一级域名下的,所以无法获得其英文网站的外部链接数和网络影响因子。其余29个高校英文官方网站外部链接数来自百度搜索引擎,数量普遍偏少,表示这29个高校英文官方网站被其它网站链接的次数比较少。

    在已获取外部链接数的29个样本网站里,根据外部链接数和网页数计算的网络影响因子从高到低排序,排名较高的是北京大学(0.557)、北京航空航天大学(0.105)、北京师范大学(0.090),国防科技大学因网页数较少,用公式计算出的网络影响因子很大,远超过其他样本网站的网络影响因子,不列入排名。北京地区的高校样本网站网络影响因子比华东、东北、华南、西部地区高校样本网站的网络影响因子高。其它几个地区的高校样本网站的网络影响因子无显著差异。

    收录量反映搜索引擎对网站的收录情况,收录量大的表示网站被关注程度高。不同的搜索引擎对同一个英文网站收录量的结果显示不同。表中的收录量来自百度,南开大学在百度中的收录量显示为2,但在谷歌搜索引擎中的收录量显示为933,吉林大学在百度中的收录量显示为15,但在谷歌搜索引擎中的收录量显示为370。收录量较高的是上海交通大学、中国海洋大学、北京师范大学。

    死链指打不开、断掉、报错的链接,是由于内容的删除或程序错误又没有及时维护更新产生的。死链接会直接影响用户体验。死链检测结果显示,有24个高校样本英文网站死链数为0,其余样本网站死链数在1到5之间,死链率极低,意味着所有样本网站的日常维护有保障。

    四、英文网站建设现状问题探讨

    (一)各高校核心网站建设相对成熟

    导航栏目规划主要有About、Admission、Academics、News、Events、Campus Life等,涵盖教学科研、学生活动、对外交流合作、人才招聘等方面的信息,并按角色浏览设置有Faculty、Students、Visitors等栏目,能提供更多有用信息。网站在美工设计上向国际看齐,设计有以Headline为主题的Banner,视觉元素冲击力强,符合国际主流设计,强调适合英语国家本土使用习惯的用户交互体验,突出各自特色,体现出全球视野的理念。

    (二)二级学院Schools英文网站缺乏统筹规划

    学校二级机构,包括管理职能部门,以及二级学院、系所、科研机构英文网站普及率偏低。在核心网站Schools页面上显示的二级学院英文网站,有的没有建链接,有的链接失效,链接访问有效的网站大都处于分散建设管理维护状态,显得高校的国际化服务水平不高。

    (三)高校普遍重视核心网站建设,但二级英文网站建设力量薄弱

    有近50%样本高校的图书馆仅建设有中文网站,没有建设英文版网站,这表明针对留学生的服务体验还有待优化。全部样本网站中有30余所高校没有在学校层面统一规划建设英文版教师主页,教师主页仅在学院网站上展示。英文教师主页是海外学生报考学校、了解教师个人信息的途径,各学院显示的教师主页分散,欠缺官方网站上的统一展示窗口。

    五、英文网站建设实践路径

    (一)强调视觉设计,凸显人文特色

    网站信息资源的功能主要是承载内容的表达,页面如何在视觉美感上给读者留下深刻印象、吸引读者,让读者内心愿意在这个页面停留下来阅读尤为重要。国际一流大学网站主体部分以简洁为主,以大图、小图、大色块、小色块来穿插使用,甚至Banner采用满屏大图来增加页面冲击力。因信息结构的不同,每一个版面的表现形式都做侧重处理,让访客浏览时视觉感受更丰富。网站的美工设计应符合国际高水平大学网站建设潮流,本着简洁大方的设计思想,进行清晰明快的版式划分,实现对校园网内信息的整合。页面设计遵循扁平化原则,没有过多的色彩和修饰,色彩搭配与视觉心理反应相适应,色彩关系满足视觉心理平衡,这样的处理能够使网站特色鲜明、重点突出。在色彩组合技巧上整体提高图片色彩的比例,实现高分辨率电脑大屏和移动终端小屏的多屏融合;与国际接轨,个性化地使用VI的标准色,实现同一色调不同深浅度分布;为了增加时代感与空间层次,采用小范围的绚丽色彩加以点缀。在图片和一些小元素的运用上,充分挖掘高校多年沉淀的历史文化内涵,传递人文思想,打造海内外有影响力的新宣传名片。

    (二)构建网站群平台的技术支撑体系

    塑造一个高校英文网站整体的外宣品牌,不仅要建设好核心网站,还要从顶层设计上统一规划协调,推动二级单位英文网站建设。无论是英文核心网站还是二级机构英文网站建设,都应该将其作为网站集群,放到网站群平台进行统一建设和运维管理。各二级单位英文网站缺少规范化的同时,存在各种安全隐患,英文网站安全性无法得到保证,分散的网站管理加大对服务器管理维护服务的依赖性,也是对技术部门管理资源的极大消耗。

    网站群平台采用垂直管理模式,站点体系呈上下级结构,自上而下统一管理,上级站点又完全拥有下级站点的所有信息资源,直接共享下级站点内的信息。内容树(Contents Tree)的概念能实现分级管理信息资源,所有的信息只需要维护一次,上级站点可以直接引用下级站点内的信息。非上下级站点之间也可以采用“信息推荐”“跨站发布”“跨站引用”等方式被其它网站引用到。这种模式实现内容的融合与共享,有利于消除信息孤岛和信息不一致的现象,核心网站和二级网站的英文信息资源可以互相引用,极大地提升学校英文翻译稿件的资源利用率。将核心网站和二级英文网站都放到站群系统并加以整合,节省二级单位网站单独建设的费用,减少网站管理员的工作量。

    (三)建立内容建设机制

    文章数的产生和内容息息相关,常态化的内容来源是影响网络影响因子的主要因素。技术部门往往缺乏内容翻译力量,而管理部门欠缺技术实现能力。要长效运维一个英文网站,就必须建立一个内容专业翻译机制和网站运作机制,并且成立一个专业的团队。高校部门分散、信息来源众多,各职能部门明确分工,形成内容产生、内容翻译、图片处理、内容审核、内容发布的常态化运作机制,内容维护从各栏目的特性出发,保障信息发布渠道的畅通,坚持定期内容更新发布,宣传学校新时期的形象。

    (四)提升海外访问速度

    英文网站的访客多在国外,海外内容分发网络(Content Delivery Network,简称CDN)服务,是保障国外访问速度的重要措施。因此,可以在现有的Internet中增加一层新的网络架构,将网站内容发布到最接近用户的网络“边缘”,使用户可以就近取得所需要的内容,提高用户访问网站的响应速度。在完成CDN业务部署后,用户在国内外访问英文网站信息资源的速度得到跨越式提升。

    (五)SEO优化

    对页面标题进行优化,每一篇文档有独立的标题。设定网站关键词为“**University、Admission、Education、Professor”,在keywords和description标签中使用。内部链接以栏目和功能为导向,结合关键词,设置更方便友好的内部链接跳转。使用重点信息HTML标签,比如 strong / h2-h5 / b 等。完善全站导航,使其具备站点地图功能。链接统计添加title,图片添加 alt 说明,增强收录导向。适当静态化,将事宜公开发布页面静态化。校内链接与反链接方面,优化校内各院系及职能部门链接,做好主页反链接(加title)。增加 robots.txt 文件。抽离 js、css 代码,让页面专注于呈现内容。

    (六)开阔全局建设视野

    在当今“互联网+”时代手机移动端的广泛应用潮流下,英文网站除了建设电脑PC端版本,手机端版本也要同时建设,以实现访客的多终端访问和网站信息资源的移动端口接入。应当更大力地推动、引导、鼓励二级英文网站建设。从研究数据来看,顶层核心网站的建设已经有比较清晰的思路,形成可复制可推广的经验,建设模式应当推广到全校:一方面要注重核心网站的顶层设计;另一方面继续鼓励二级学院、系、所等科研机构大胆建设英文网站,注重探索网站死链接查询工具,注重核心网站先行,并使顶层设计和先行探索有机结合,不断将高校整体英文网站建设引向深入,借助网站的传播广度和渗透深度,宣传高校的发展成果,加快国际化办学进程,积极谋划、参与国家一流大学和学科建设。

    参考文献

    [1]邱均平,张洋.网络信息计量学综述[J].高校图书馆工作,2005,25(1):1-12.

    [2]王知津,郑红军,张收棉.网络计量学的理论、方法及应用[J].中国图书馆学报,2005(4):11-14.

    [3]赵丹群.网络信息计量学研究与发展评述[J].情报理论与实践,2019(6):154-158.

    [4]黄贺方,孙建军.基于链接分析的网站评价实证研究[J].情报杂志,2011(1):74-77.

    [5]徐芳.基于链接分析法的我国省级教育信息网站影响力评价研究[J].现代情报,2012,32(9):168-171.

    [6]张倩,滕红,袁小姗.基于链接分析法的我国主要商业银行网站影响力评价研究[J].情报科学,2011,29(6):833-837.

    [7]李江.链接指标用于网站评价的缺陷分析[J].图书馆杂志,2008(5):40-44.

    [8]段宇锋,邱均平.基于链接分析的网站评价研究[J].中国图书馆学报,2005(4):19-23,41.

    [9]杨木容.搜索引擎在网络链接分析中的应用研究[J].图书情报工作,2006,50(11):91-94.

    Evaluation of University English Website and Implementation Path Based on Webometrics

    Lingyan ZHANG, Huanming ZHANG, Yingyi TANG

    (Network and Educational Technology Center, Jinan University, Guangzhou 510632, Guangdong)

    Abstract:On the webometrics link analysis of construction and influence of “Double First-Class” university English websites, this paper makes an empirical study and obtains its construction characteristics, which can provide valuable suggestion and reform direction for the construction and development of university English websites under internationalization context。 Although this method is widely used, it relies on the availability of search engines such as Alltheweb and Google。 So we select the English websites of “Double First-Class” universities as the research samples when the main search engines are not available。

    Based on the link analysis method, we reset multi-dimensional website evaluation indicators to acquire and process indicator data, calculate network impact factors, then summarize the problems of core websites and secondary college English websites in the current situation of university English website construction, and discuss the construction ideas of domestic university English websites。

    Keywords:Webometrics;Link analysis;Evaluation; University English website

    版权声明

    本文仅代表作者观点。
    本文系作者授权发表,未经许可,不得转载。

    发表评论