找出不同类的一项4篇
【引言】阿拉题库漂亮网友为您分享整理的“找出不同类的一项4篇”范文资料,以供参考学习,希望这篇文档资料对您有所帮助,喜欢就下载分享给朋友吧!
找出不同类的一项【第一篇】
关键词:数据挖掘 apriori算法 图书馆管理 读者管理
数据挖掘技术在商业领域内的应用给图书馆带来了很大的启发。图书馆的数据库可以运用数据挖掘技术中的关联规则分析、聚类分析、决策树、时间序列分析等数据挖掘方法,以找出数据库中蕴藏的对于图书馆管理有用的潜在规则,并且通过描述和预测,为图书馆的图书采购、读者服务、馆藏目录设置等管理工作提供决策支持。
关联规则是与多数人想象的挖掘过程中最相近的一种数据挖掘形式,即寻找在同一事件中出现的不同项的相关性。关联规则的研究有助于发现数据库中不同商品间的联系,找出顾客购买行为模式。在图书馆运用关联规则分析可以细分出读者群,根据其借阅情况提供不同的服务,为图书馆的管理决策提供参考。关联规则的核心算法是apriori算法。
关联规则的基本概念及算法
挖掘流通借阅事务数据库中所有的关联规则的问题可以被划分成如下两个子问题:
找出所有具有最小支持度的项集(即频繁项集),可用apriori算法来找出频繁项集。由频繁项集产生强关联规则,对于每一个频繁项集i,找出其中所有的非空子集,然后,对于每一个这样的子集a,如果support(i)与support(a)的比值大于最小置信度,则存在规则a=>(i-a)。
(一)关联规则算法
关联规则的挖掘主要是在数据库中找出支持用户指定的最小支持度s和最小置信度c的关联规则,从而指导人们的一些管理决策。目前,关联规则的挖掘方法主要是找出数据库中的频繁项集,然后由频繁项集产生关联规则。
(二)aprior算法
apriori算法是一种挖掘布尔关联规则的频繁项集的算法,它主要是利用逐层搜索的迭代方法来寻找数据库中频繁出现的项集。主要步骤是:第一步,产生频繁1-项集l1,扫描数据库d,出现在d中各个数据项的集合就是频繁1-项候选项集c1,并统计出每个数据项出现的次数,次数大于最小支持计数(预先)定义的项的集合就是频繁1-项集l1;第k步,产生频繁k-项集lk,利用上一步产生的频繁(k-1)-项集lk-1,与自己连接产生k-项集候选集ck,扫描数据库事务库,计算ck中每个成员出现的次数,将小于最小支持度的候选项删除,最后产生频繁k-项集。
算法:apriori使用根据候选生成的逐层迭代找出频繁项集
输入:流通借阅数据库d;最要支持度阈值minsup
输出:d中的频繁项集l
算法代码:
1)l1一所有频繁项集1-项目集;
2)for(k=2;lk≠φ,k++){
3)ck=apriori_gen(lk-1,minsupport)
4)for all c∈ct do{
5)ct=subset(ck,t)
6)for all c∈ct do
7)++;
8)}
9)lk={c∈ck|support(c)>=minsup}
10)}
11)return l={所有的lk}
apriori算法的第1步找出频繁1-项集的集合l1。在第2~10步中,lk-1用于产生候选ck,以找出lk。apriori过程产生候选,第3步使用apriori性质删除那些具有非频繁子集的候选,第4步扫描数据库,第5步使用subset函数找出事务中的候选的所有子集,第6步和第7步对每个这样的候选累加计数。最后,所有满足最小支持度的候选会形成频繁项集l。
apriori-gen过程
apriori-gen过程由lk-1产生第k次迭代时的候选项集ck,该过程描述如下:
for each itemset i1∈lk-1
for each itemset i2∈lk-1
if (i1[1]=i2[1])∧(i1[2]=i2[2]∧…∧(i1[k-2]=i2[k-2])∧(i1[k-1 ]=i2 [k-2])∧(i1[k-i]=i2[k-1])
then {c=i[1],i1[2],…i1[k-i],i2[k-1]);
ck=ck u c;
for(c的每个包含k-1个项目的子集s){
if(s不属于fk-1)
从ck中删除c;
}
return(ck);
改进的apriori算法在图书馆的具体实现
以安徽省图书馆某年度读者借阅事务库为例,可从图书馆借阅记录中挖掘出形如“读者-图书”强关联规则。首先要进行数据清洗,只保留属性概念中分层最低层的属性项,将同一个读者的所有借阅记录合并为一条记录。
(一)算法思想
在读者借阅记录关联规则挖掘过程中有一些特殊的性质,因为每一个读者借阅记录的长度是固定的,即含有五个单项,前四个是属性值,最后一个是图书分类号,并且要挖掘的规则最后一项必须是图书分类号,且不能出现冲突的属性值或图书分类号。基于这些特殊性质,在数据挖掘中对apriori改进算法如下:
1)把压缩过的事务集读入内存;
2)扫描事务集,找到每一类频繁单项:即频繁的年龄段、频繁的学历、频繁的职称、频繁的职业、频繁的图书分类。
3) 把各类频繁的属性单项和频繁的图书分类单项连接成 2 - 候选频繁项集, k = 2。即生成年龄-图书类,学历-图书类,职业-图书类,职称-图书类,分别生成频繁2项集。
4) 检查k-候选频繁项集,记录其支持度和前件的支持度。频繁项集的连接条件是前n项是为读者属性项,且读者的属性项内容各不相同,最后一项为相同的图书分类项。
5) 输出置信度和支持度达到要求的频繁 k - 频繁项集。置信度为支持度除以前件的支持度。
6) 用得到k - 频繁项集互相连接得到k+1 - 候选频繁项集。通过剪枝,可减少连接的频繁项集的个数,提高程序运行的效率。下面的是剪枝连接的规则:
a) 如果频繁项集a 和 b 最后一项不同的时候不能连接。
b) 含有属于同一属性类别的不同单项,则不能连接。
c) 频繁项集也不能和自身连接。
d) 如果用conf代表前件支持度,那么当min ( , )/最小支持度<最小置信度时,不能连接 a,b。
e) 其它情况可以连接。
7) k ++, 如果生成的候选频繁项集数目不为0,转4),否则结束。
本算法主要改进是步骤6, 这是经典的apriori算法没有的。其他的连接过程可以参阅apriori的连接。本文通过设置最小置信度阈值以找出强关联规则,令图书类型为每条规则后件,读者属性为每条规则前件,最后得到关联规则。
(二)程序实现
// apriori算法的程序
void apriori::do()
{
vector candidates;
vector patterns;
generate2candidates(candidates); // 生成候选2项集
while(!()) // 当候选项集为空时中止
{ verify_candidate(candidates, patterns);// 过滤候选k-1项集, 返回用于连接生成候选k项集的列表,同时输出满足所有条件的规则
generate_k_candidates(patterns,candidates); // 连接生成候选k项集, 准备下一次循环
();
}
}
生成k项候选频繁集:
inline void apriori::generate_k_candidates(const vector&patterns,
vector&candidates)
{
for(int i = 0; i < (); ++i)// 遍历过滤后的候选k-1项集, 两两连接
for(int j = i+1; j < (); ++j)
if(items_method::is_compatible_items(patterns[i].items_,patterns[j].items_))// 首先判断能否连接
if((double)min(patterns[i].freq_,patterns[j].freq_) / minsupport_ >= minconf_)
{items items = items_method::join_items(patterns[i].items_,patterns[j].items_);// 连接得到k项集, 保存到输出列表
_back(itemscounter(items,0,0));
}
}
(三)算法评价
通过上述的介绍,可以看到本算法的思路基本上与apriori算法保持一致,即它们的共同之处是通过扫描数据得到那些支持度不小于用户给定的最小支持度的频繁项集,但是又有不同之处就是在扫描数据库之前就进行了剪枝,在剪枝后再重新连接扫描数据库,减少了扫描的次数。
在算法效率上,通过数据压缩可将挖掘的数据一次性扫描进入内存中,避免了重复磁盘i/o操作,没有压缩的数据不可能一次性读入内存,从而提高了计算效率;另通过数据压缩减少了每一项字符长度,特别是在比较两项是否相同的时候,需比较的字符数就少了很多,可以提高运算速度。通过使用数据压缩的方式,节省了内存,减少了候选集比较的时间,从而生成频繁项集速度将更快,同时加入了同属性列只能出现一次和后件必须相同的约束,使得连接次数大大减少,计算复杂度也降低了。在对图书馆这样的大型数据库而言,这种节省对数据挖掘效率提高的作用就显而易见。
(四)关联规则挖掘结果分析
根据以上关联规则挖掘结果分析,可以看到这种算法改进具有一定的实际意义:
通过研究读者群体的特征和关系,可以按年龄、学历、职业等因素对读者群体进行分类,也可以进行聚类,把读者群体细分,可以更清楚地了解读者的特点和需求;通过以上挖掘出的规则,进一步了解读者的特点,提高图书馆的吸引力,改进读者服务和提高读者的满意度;可以统计出读者的借阅频率、书籍流通趋势和周期,通过更科学地规划馆藏,提高图书的借阅率;通过分类,对重要的读者提供更优质的服务,从而使读者忠诚度更高;提高图书馆管理效率,提高决策水平,改进服务流程,使图书馆的服务流程更合理,最终提高管理效率;提高读者兴趣度,改善采购水平和质量,购进读者需要的书籍;通过科学规划馆藏目录,提高馆藏借阅率。
总之,apriori算法能有效地进行关联规则的数据挖掘。本文根据图书数据挖掘中最后一项是固定的图书分类的特点,提出的改进apriori算法,是根据图书馆数据特点进行连接和剪枝,生成频繁项集,进一步缩小了挖掘的范围,提高了数据挖掘的效率,使得到的规则更加科学合理。
参考文献:
找出不同类的一项【第二篇】
目前此类工具很多,而且各有特点。问题是我们怎样根据自己的需要,并结合软件自身的特长,来找到真正适合自己的一款呢(唯有适合才是最好)?也许下面我们将要介绍的四大名捕将给你答案。这四款工具包括大名鼎鼎的EMCO LAN File Search、LAN Search Pro、Search My Network和NetworkSleuth。
内容查询 EMCO LAN File Search
适用:办公用户
之所以建议办公用户使用EMCO LAN File Search进行内网文件搜索,是由此类用户最常接触的文件类型决定的。通常来说,企业内网中共享出来的文件,多是Word文档和Excel报表等。那么,此类用户对内网搜索工具的基本需求是,除了能够以文件名的形式进行搜索外,还能直接搜索文档中的内容。
目前,在所有流行的内网搜索工具中,EMCO LAN File Search对文本内容的搜索支持是最好的。在搜索到需要的文件之后,还可以对该文件进行拷贝、移动、重命名、打开等多项操作,利用它的这些功能,无疑能极大地提高工作效率,简化一些繁琐操作。尤其值得一提的是,该工具同时还提供了将网络文件夹映射为本机逻辑盘的功能,这样,以后再要打开一些常用文件夹时,就会便捷很多。
安装后运行程序,在主界面的“Search text”文本框中输入要查找的文本关键字,单击“Start Search”(开始搜索)按钮,在指定搜索范围内,所有内容中包含此关键字的文件就出现了,非常方便。
在列表中右击某文件,在出现的右键菜单中,选择“Open”(打开)、“Copy”(复制)、“Move”(移动)等命令,可对文件进行相应操作,而如果该文件或文件夹比较常用,想将其映射为本机磁盘也简单,只需选择“Map Network Drive”(映射网络驱动器),打开“映射网络驱动器”对话框,再按提示操作即可(如图1)。
压缩包搜索NetworkSleuth
适用:教育工作者
教育工作者在日常的内网共享中,难免要同大量的多媒体课件、图片资源打交道。同时,为了尽可能地减少文件体积,共享者通常会将这些文件压缩打包。这样,问题就出现了,虽然可以通过文件名,快速搜索到自己需要的课件,但如果我们要寻找的资源恰恰是藏在压缩包中,又该怎么办呢?因此,教育工作者在选择内网搜索工具时,就必须考虑到让该工具能直接进入压缩包内进行搜索,比如这里为大家推荐的NetworkSleuth,就能很好地满足上述需求。
在程序主界面的左侧选择“Computers”项,在其下的列表中依次选择“Entire Network”、“Microsoft Windows Network”、“WorkGroup”项,在该分支下选择要搜索的内网主机(默认为全选)。然后在“Search options”(搜索选项)项的“File name”(文件名)文本框中,输入要搜索的文件名(支持通配符和多个文件类型,不同文件类型间以“/”分隔),同时勾选“Advanced”项,然后在出现的下拉菜单中,勾选“Search in ZIP archives”(搜索ZIP文件)项(如图2),返回程序主界面,单击工具栏中的“Start Search”(开始搜索)按钮,符合条件的文件就出现了,其中也包括那些打包在ZIP压缩文件中的文件。
搜索隐匿文件LAN Search Pro
适用:学生用户
学生用户使用内网搜索工具的目的,主要是迅速找到自己需要的学习资料,不过,它们之间也有两个较大的不同:一是校园网中共享出来的文件,并不全部是保存在常规的共享文件中,有许多可能是散落在网内匿名的FTP服务器之中;二是由于学生团体独有的小圈子性,往往一个圈子中共享出来的珍贵资源,不希望被其他校友看到,这样的文件通常会被设置为隐藏属性。因此,学生用户所选择的内网搜索工具,除了要同时兼具办公和教育用户的特点外,还必须能同步搜索匿名服务器中的文件及属性为隐藏的文件。
考虑到这些需求,所以这里推荐的工具为LAN Search Pro,它功能适中,搜索速度很快,而且是免费工具,完全能满足此类朋友的需求。
在程序主界面的工具栏中,单击“Option”(选项),打开相应的对话框,切换到“Net search”(网络搜索)标签,在其中设置好搜索范围(默认为“Entire network”,即整个网络),然后切换到“Hidden folders”(隐藏文件夹)标签,勾选“Common and hidden folders”(普通的及隐藏的文件夹),再切换到“FTP”标签,勾选“Shared and FTP resources”(共享和FTP服务器资源)。这样在“Search files”(搜索文件)文本框中,输入要查找的文件名称(支持通配符搜索指定类型的文件,比如输入“*.mp3”,即可查找网内所有共享出来的和FTP服务器中存在的MP3文件。如果查找多个文件或类型,不同的文件间要以半角分号分开),单击“Start Search”(开始搜索)按钮,稍等片刻,所有符合条件的资源就会显示在结果列表中(如图3)。
此外,LAN Search Pro还有一个特性可给学生朋友带来方便,那就是当某个文件经常使用时,我们可以在右键菜单中选择“Shortcut to Desktop”(发送快捷方式到桌面),将其快捷方式发送到桌面,以便以后能随时调用。
速度为先Search My Network
适用:普通用户
所谓普通用户,是指使用局域网共享文件的目的比较杂乱的用户,他们使用共享文件的目的,通常会包括多个方面,如办公、娱乐、软件共享等。而娱乐所涵括的方面则可分为图片和影音文件等。因此,此类用户选择内网搜索工具的一个最大特点是功能不一定擅长于一个方面,但搜索速度要快,功能一定要较为全面。比如,在搜索图片时,为了尽可能避免搜索到一些分辨率较低的图片,需要该软件能够以文件大小为条件进行过滤,同时,为了能及时找到最新的共享资源,还要求能够以时间为条件进行搜索。因此,这里我们为大家推荐的工具是Search My Network。该工具除了搜索速度较快外,还允许以尺寸过滤、时间过滤等方式进行搜索。
找出不同类的一项【第三篇】
本文主要分析了“戴明循环”在工程质量控制中的应用,运用统计的思考方法,结合项目质量控制的技术方法进行分析。主要结合使用的技术方法有排列图、因果图、分层法、直方图、控制图、相关图和调查表法等。通过四个阶段,八个步骤周而复始的运行,以实现拟定的质量目标,并且保证了质量的持续改进。
PDCA循环能使管理工作更切合实际,且层次分明。项目质量控制就是在这样的不断的循环中进行,这种循环不是简单的重复,而是沿着项目持续改进的方向不断提升产品质量。
关键词:戴明循环质量控制
中图分类号: 文献标识码:A 文章编号:
“戴明循环”是美国质量管理专家戴明20世纪50年代初提出来的,它是提高工程质量和工作质量、有效进行任何一项工作的合乎逻辑的的科学工作程序。四个阶段不是循环一次就结束,而是周而复始的进行,循环一次,解决一些问题,质量提高一步。未解决的问题进入下一个循环,这样螺旋上升的。从而使工程质量得到持续的改进。
项目质量管理的一项重要活动是质量控制。质量控制是贯穿于产品形成的全过程,应包括所有与质量有关的作业技术和活动。质量控制是一个动态的过程。在项目的质量控制中,对过程的监控和改善是项目质量控制的主要手段。质量管理首先开始于确定目标和制定计划,继而进行资源组织和人员配备,找出偏离目标和计划的误差,确定应采取的纠正措施,以实现预定的目标。就项目质量控制的过程而言,质量控制就是监控项目的实施状态,将实际状态与事先制定的质量标准作比较,分析存在的偏差及产生偏差的原因,并采取相应的对策。这是一个循环往复的过程,对任一控制对象的控制一般都按这一过程进行。即计划(Plan)、实施(Do)、检查(Check)、和处理(Action)四个阶段,在项目质量控制中,这四个阶段循环往复,形成PDCA循环。
“戴明循环”(PDCA循环)分为计划、执行、检查、处置4个阶段,可以进一步具体划分为8个步骤
(1)找出存在的主要质量问题。针对某个分部分项工程分析质量现状,通过调查表的方式。统计相关的数据,经过数理分析找出主要问题。。
(2)分析质量问题的产生原因。从“人、机、料、法、环”五个要素上分析原因。
(3)找出导致质量问题的主要因素。运用“因果分析图”找到影响质量问题的主要因素。
(4)拟定质量提高措施。针对影响质量的主要因素,拟定具体的执行方案。
(5)按照所制定的计划具体实施。
(6)检查计划的执行情况及时处理问题。这是整个循环的关键,发现问题及时进行原因分析,采取必要的措施,予以纠正,提出质量改进措施,保持质量形成的受控状态。
(7)总结经验教训。反思问题症结或计划时的不周,为今后类似问题的质量预防提供借鉴,同时防止再度出现同样的问题。该步骤的工作重点是订标准和制度。成功的经验进行推广并标准化,失败的教训加以总结,在制度里增加预防措施。
(8)第二次循环。将本次的PDCA循环没有解决的问题作为遗留问题转入下一次的PDCA的循环,成为新的目标,再进行第二次的戴明循环,使产品质量和工作质量进一步提升。
下面结合建筑工程的实际案例,介绍戴明循环在质量控制中的应用。
某小高层住宅项目,针对首层顶板模板质量问题进行了专项的检查,目的是提高顶板模板的质量。
1、利用调查表法,统计质量问题的现状。
调查表法是利用表格的方式进行质量特性的收集和统计,以便进行初步分析的一种简便方法,可用于分部分项工程质量检查、工序质量检查等问题的统计检查。
针对首层顶板模板进行了专项的质量检查,抽查了100个不合格点并进行了统计分析。统计结果如下:
表1:调查表
2、利用排列图计算表,进行质量问题排序。
排列图法是主次因素排列图法的简称,也称为帕累托图法。最早是意大利经济学家帕累托用来分析社会财富的分布状况。后来,美国质量管理专家朱兰博士运用帕累托的统计图加以延伸将其用于品质管控分析和寻找影响质量主要因素的一种工具,并广泛应用于其它的专业管理。
排列图按重要顺序显示出每个质量改进项目对整个质量问题的作用,识别进行质量改进的机会,用以分析质量问题的主次和质量问题原因的主次。本排列图计算表是按不合格点数分类,分类后将不常出现的项目归为“其它”项。
接下来根据调查表(表1)中出现问题频数从大到小进行排列,并计算累计频率得出排列图计算表
表2:排列图计算表
3、绘制排列图,找出主要的质量问题。
排列图排列图用双直角坐标系表示,左边纵坐标表示问题发生的数量(频数),右边纵坐标表示问题的累积频率(百分率),分析线表示累积频率,横坐标表示问题的种类和项目(影响质量的各项因素),按影响程度的大小(即出现频数多少)从左到右排列,通过对排列图的观察分析可以抓住影响质量的主要因素。
排列图是一种重要的优先程度排序技术。一般来说,关键的少数项目应是本QC小组有能力解决的最突出的一个,否则就失去找主要矛盾的意义。通过找出一部分产生最大影响的问题来源,以保证大部分质量问题得以解决。
(1)画坐标图。
横坐标按质量单位量递减的顺序自左向右列出项目,将量值最小的一个或几个项目归类为“其它”项,把它放在最右端。
在横坐标的两端画出两个纵坐标,左边的纵坐标按度量单位规定,其高度必须与所有项目度量单位的量值和相等,右边纵坐标应与左边纵坐标等高。
(2)按频数大小画矩形,矩形高度代表频数大小。
在每个项目(如平整度、截面尺寸等)上画矩形,其高度表示该项目度量单位的量值,用以显示出每个项目的作用大小。
(3)画曲线。
由左至右累加每一项目的量值(百分率),并画出累计频率曲线,用来表示各项目的累计百分比。
(4)利用排列图确定质量改进的主要项目。
图1:排列图
通过分析排列图,利用ABC分类法确定主次因素,:
A类(主要因素):频率的分布范围在0-80%
B类(次要因素):频率的分布范围在80%-90%
C类(一般因素):频率的分布范围在90%-100%
由图可见主要因素为表面平整度、截面尺寸;次要因素为起拱;一般因素有垂直度、标高和其他项目,因此应重点解决表面平整度及截面尺寸问题
找出不同类的一项【第四篇】
关键词总承包档案;组卷方式
工程总承包项目是总承包商按照合同约定,完成工程的勘察、设计、设备材料采购、施工、试运行等工作,并对工程的安全、质量、进度、造价全面负责,工程验收合格后向业主移交,即在"交钥匙"时,提供一个配套完整、可以运行的设施。通常称之谓EPC (Engineering Procurement and Construction) 总承包。相对于只负责勘察、设计的传统模式,总承包模式增加设备材料采购、施工等环节,因此产生的文件也是原来传统模式的几何倍数增加。我院从总承包项目工程开始,就从实际情况出发,为了整编和利用方便,提出了根据不同类型的文件分别按照按“卷”、按“件“并存的文件组卷整编方式。
一、“卷”和“件”概念的区分
“卷”:由互有联系的若干文件组合而成的一种档案保管单位。案卷一般由封面、目录、文件材料、备考表组成。
“件”:是比卷更小的档案保管单位,一“件”可以是一份文件(包括附件),如一个通知、一份报告;也可以是若干份相关文件的组合,即组合件,如来文与复文等。
二、按“卷”组合
目前我院总承包文件中成品图纸文件是按照先归档后出版的形式归档的,因此成品文件归档的质量是可控的,而且通过系统运用,也方便查阅利用。而如何总承包各环节产生的除成品文件外大量的其他原始文件才是难点和重点。在工程资料整编中,按“卷”是传统的整编方式,我院总承包项目文件按“卷”整编流程与传统整编流程基本是一至的:组卷、排列、编目、装订四个步骤。由于总承包文件类型多,数量大,因此组卷是整编中的难点,而组卷的合理与否直接影响到档案的查阅利用是否方便快捷。我院现在存在的问题是:由于之前文件组卷不合理,执行规范不严格,造成卷内文件类型多,内容乱的现象,这样在后续的编目编写案卷名称时很难全面地概括卷内文件所包括的内容,造成日后的查找利用时出现想查找一份文件,但由于案卷名称没有涉及这份文件的内容,因此很难找到甚至找不到需要的文件。为了让总承包项目文件严格执行分类组卷标准,根据我院三年来总承包项目产生的文件资料和我们的整理经验,我院摒除了原始档案中“类”的分类组卷方式,编写了更加细化的组卷分类形式,具体分为19个类型的文件,分别为:工程前期文件、设计文件、施工技术文件、项目启动与策划、设计管理、采购管理、施工管理、调试与试运行文件、质量管理、进度管理、HSE、费用管理、财务管理、行政与后勤、联络性文件、声像资料管理、风险管理、竣工验收文件、合同与协议。在以上的类型文件作为一级类目的前提下,再细分各种文件类型,编写出二级类目,甚至三级类目。这样细分归档文件类型的目的是为了使同一卷文件具有统一的特征,方便后续的编目工作,也方便日后的查阅利用。
三、按“件”组合
在工程原始资料中采用按“件“整编,是近几年才流行的一种工程原始资料整编方式。按”件”整编主要用于文书类档案的整编,而在工程原始资料整编中,按“件”整编的方式主要适用了项目的前期文件、联络性文件和合同协议等。这类型文件的主要特点是:文件内容的独立性强,一份文件即是一个完整的闭环文件。按“件”整编的流程也相对简单,只要分类,装订即可,分类规定执行上述19类别。我院现在除总承包项目外的其他项目原始资料也是按“件”的方式整编,这种整编方式少了编写案卷封面、卷内目录和备考表的程序,为整编带来更多的便利,而且在文档系统上编写的题名也相对简单概括,更便于日后的查阅利用。
四、按“卷”组合与按“件”组合对比
文件如何整理归档,最终的目的是为了方便日后档案借阅利用,档案的价值正体现于此,所以如何将一份死档案变成一条活信息,是每个档案工作者亟需思考的问题。文件整编方式的改进是提高档案利用效率最直接的一种方式。组卷是文件整编的一个重要环节,如何选择适合一类型文件的组卷方式,需要了解一类型文件的产生、形成、收集的全过程,为后期的整编提供依据。比如:工程联系单(收文)与(发文)的收集,不同工程的文控人员收集的方式不一样,有收文和发文分开收集的,有收文和发文相关联收集的,因此根据不同的收集情况,组卷方式也应该不同,工程联系单(收文)与(发文)分开收集时,应分专业分别组“件”;工程联系单(收文)与(发文)相关联收集时,应该按收、发文相关联组“件”。但如设备的招投标文件中,包括邀标通知书,投标说明文件、招投标过程中产生的传真、会议纪要、中标通知书等文件,都是在同一设备招投标中产生的文件,对这种具有很强关联性的文件,我院是按文件问题组“卷”方式组合的。在选择按“件”还是按“卷”组卷时,我们遵循一个原则:按“件”组卷同一类型的闭环文件;按“卷”组卷多种类型的闭环文件。在遇到文件交叉的情况时,优先考虑方便文件收集时的组卷方式。
在实际工作中,文控人员对档案整编知识相对较少,因此更简单的按“件”方式组合整编比按“卷”方式组合整编更适合整编人员操作。对比两种方式,按“件”整编的优势在于:①组卷方式更简单;②编目内容更少;③选择装订方式范围更大。④案卷题名更容易概括;⑤在档案系统上更容易查找定位。但这种组卷整编方式也有不好的地方:产生大量的条目信息,因此在档案系统上登记更繁琐;在借阅利用,查找相关联的文件时,需要进行多次的检索。按“卷”方式组合整编的优势:①卷内文件内容联系性强,减少在借阅利用时对关联性文件的检索次数;②产生的条目信息更少,减少档案系统的登记量。按“卷”方式组合整编的劣势也非常明显:编目内容更多,且内容的增多造成文件厚度的加大,使装订方式更多只能选择更加复杂的“三孔一线”的方式;卷内内容的增多造成案卷题名难以编写,给后续的查找利用造成不利。
五、结束语
显然,两种的文件组合整编方式各具优势,也有各自的缺点,因此根据不同类型的文件选择合适的组合方式是极其重要的。充分考虑不同文件组合方式的特点,利用不同文件组合方式的优势,做好文件收集与文件利用的桥梁作用,让更好的文件组合方式成为档案工作中的剂,提高档案工作效率。总承包项目档案管理模式还在探索建设阶段,因此总承包项目产生的文件如何组合,需要档案工作者在不断的实践中得出最有效的方式。