摘要:我们将微信公众号理解为是网络服务平台,即第三方;公众号的运营单位,是信息发布的站点,即信息发布者,也可以理解为网站、门户等;公众号的信息内容,是发布的内容页面,即网页信息。
我们将微信公众号理解为是网络服务平台,即第三方;公众号的运营单位,是信息发布的站点,即信息发布者,也可以理解为网站、门户等;公众号的信息内容,是发布的内容页面,即网页信息。
《机关档案管理规定》中一级档案门类有13种,其中包括“网页信息(WY)”类档案。网站网页作为一种新媒体,已经成为一种重要的档案类型,具有保存价值,具有重要意义。而在《政府网站网页归档指南》(DA/T80——2019)规定了政府网站网页的归档范围和网页档案的保管期限。非政府网站,也可以此为参考,制定自己的网站网页归档范围和保管期限表。
档案之所以是档案,是因为它是有保存价值的历史记录。而网页档案是对国家和社会具有保存价值并归档保存的网页信息。纸张作为文字的载体,加速了人类文明的进步。目前,纸质档案是最为丰富的档案类型,易于保管、能长期存放,这都是纸张的优势。时代在进步,社会在发展,人类进入了信息化、网络化的新时代,新技术新手段改变着我们的衣食住行,也在改变着档案的传统观念。
某单位公众号归档,就是将公众号的首页、合集页、内容页按照《政府网站网页归档指南》的要求进行归档。
一、保管期限
“首页”为永久保管,“合集页”为30年保管,“内容页”涉及本单位的为30年,转载其他网站、公众号、报刊杂志书籍的为10年。
二、收集时间
公众号更新较为频繁的,例如每天都有更新内容的,可以设置每天定时收集;更新不频繁的,可以根据更新频率确定合理捕获周期,如三天收集一次,每周一收集一次等。
三、收集手段
1、人工收集
手工打开页面,通过“保存”功能,将相关页面存储下来;手工著录网页元数据,如标题、发布时间、来源、关键词、作者、摘要、网址等。
“标题”著录格式如下:
②捕获日期+公众号名称+合集页+合集名称
③捕获日期+公众号名称+内容页+内容名称如:档案百科 新颁发《22号令》-电子档案管理办法
2、自动收集
开发软件,定时自动打开页面,自动“保存”页面,自动捕获网页元数据。
四、收集内容
应为页面的完整信息,即打开页面后看到的全部信息。公众号页面作为网页的一种,页面中会有文字、图像、视频、链接等,仅收集静态页面,较为简单,保存为快照图片格式,一页一图即可;需要保持视频的可播放,链接的可用性,则需要保存为网页格式,看到的是一个页面,背后还有无数的子文件。
五、归档文件格式
归档为版式文件格式,一般为PDF或OFD。电子版本的文档,只是电子文件,不符合电子档案的要求,可以打印出来和其他纸质文书档案一同归档。若单位有业务系统,而且实现了电子档案归档,可以将文字版本的文档通过业务系统进行运转,然后以电子档案的形式归为文书档案。
现如今新媒体成为了主要的信息交流媒介,从微博、微信、新闻网站到视频分享平台,每一个平台和网站都会产生大量的文本、图像、音频等不同类型的数据。由于新媒体数据的格式繁多和内容多样,其存储方式要比以往档案信息的保存更为复杂,如何选择合适的文件格式进行存储成为了一个至关重要的问题。
来源:科技腾飞