摘要:当实体用于描述活动时,把实体聚合成主题数据库的另外一种技术就成为可行的了。
5.5.4最亲合性分析
当实体用于描述活动时,把实体聚合成主题数据库的另外一种技术就成为可行的了。如图最5.15最中的最一种矩阵可以出来表明一个实体与其他实体的亲合程度。
首先假设有两个实体最E,和最E.,如果它们从来没有被相同的活动使用,那么它们的亲合度为零;如果它们总是同时被每一个活动所使用,那么它们的亲合度为最1;许多实体仅被某些活动一起使用,其亲合度在(0,1)区间内。
计算机能够检验每个活动并计算出:
(E1)=使用实体最E1最的活动数目
(E1,最E2)=同时使用实体最E1,最E2最的活动数目
用这些数字可以计算出两个实体的亲合因子,求亲合因子的一种方法是:E1与最E2最亲合度=a(E1,最E2)/a(E1)
亲合因子可以用一个矩阵形式表示出来,图最5.最15最所示。
图最5.15最表示两个不同实体之间所计算的亲合度矩阵,该矩阵可用于把实体聚合成主题数据库。
如果两个实体的亲合度比较高,则它们应该在同一个主题数据库中;如果它们的亲合度为。,则不能最放在同一个主题数据库中。然而分界线在什么地方呢?
计算机可以把实体按亲合度分类,如果把亲合度为最0最的实体分在相同的组,那么就只有一组;如果把最亲合度为最1最的实体分在相同的组,则分组的个数可能等于实体个数。也可以把亲合因子分成能够产生最20,30最或者设计要求的那么多组,这些组用作主题数据库。
亲合因子没有考虑到每一个活动的使用情况,另一种不同的计算亲合度的方法也许能考虑到活动的使最用情况。在使用中,当自动地把实体组合成主题数据库时,这种方法给出了较理想的结果。
假若想要按图最5.15最把实体组合成数据库,那么对实体按照亲合度的大小存放,从高亲合度开始。每个具有较高亲合度的实体对形成该聚合的核心,于是:
E1,最E4最(亲合度=0.最92)
E11,最E8最(亲合度=0.90)
E6,最E7最(亲合度=0.88)
E10,最E12最(亲合度=0.87)
终于得到一实体对,其中一个实体已经在一个聚合中;假设碰到的下一个实体对是最E2,最E8最(亲合度=0.最85),最E8最已经分配给了聚合最E11,最E8.那么应该把最E2最与哪一聚合联系起来呢?为了确定这一点,必须计算E2最到最E11、最E8最的加权亲合度。
设最E11最用于最3最个活动中,E8最用于最48最个活动中,最E2最与最E11、E8最的复合亲合度为:
(0.34×3+0.85×48)/(3+48)=0.82
这个值大于图最5.15最中余下的任何亲合值,所以最E8、E11、E8最形成一个聚合。
今后,当我们遇到新的最E8、E11、E8最亲合的实体时,我们就计算它们的复合亲合度,用这个方法构成的最具有高亲合度的聚合的实体在稳定地增加。
图最5.15最中下一个具有最大亲合度的实体对是最E7,E4(亲合度为最0.76),然而最E7最和最E4最都分别分派到了一个最聚合中。那么,这些聚合也应该被组合起来吗?为了确定这一点,先计算最E7与现存的聚合最E1,最E4的复合加最权亲合度以及最E7最与最E1,最E4,最E6最的复合加权亲合度。假设各自的亲合度分别为最0.55最和最0.37,它们都低于表最中下一个实体对的亲合度。即最E8,E10最的亲合度为最0.74,首先应该处理这一对实体。最后,每个聚合的决最定都按亲合度数的大小顺序排列。
处于亲合数序列末尾的某些实体与其他任何实体的亲合性都是微乎其微的,这些实体可以作为文件系统或独立的数据库来实现,设计者应该认真观察所余下的低亲合度的实体,看它们是否属于任何现存的数据库。
章节目录:
返回全书目录:系统分析师章节辅导教程
软考备考资料免费领取
去领取