JS中的算法与数据结构——集合(Set)

比眉伴天荒 2022-09-11 11:22 317阅读 0赞

集合(Set)
同数学中所学的一样,集合(Set)是由一组无序但彼此之间又有一定关系性的成员构成,每个成员在集合中只能出现一次,它是一种包含了不同元素的数据结构(集合中的元素称为成员),从其定义中我们可以看出它具有两个很重要的特征:首先,集合中的成员是无序的,其次,集合中的成员是不相同的,即集合中不存在相同的成员。

实际上,很多编程语言中,集合并不是一种数据类型,但是如果你需要创建一个数据结构用来保存一些独一无二的元素时,集合就变得很有用了,接下来我们一起来看看JS中如何实现一个集合。

集合的定义
我们要实现一个集合,首先要对其一些定义做了解

不包含任何成员的集合称为空集,包含一切可能成员的集合称为全集。
如果两个集合里的成员都完全相同,则称两个集合相等。
如果一个集合所有成员都包含于另一个集合,则前一集合称为后一集合的一个子集。
集合的操作
通常来说,集合的基本操作有以下三种:

并集:将两个集合中的成员进行合并,得到一个新的集合
交集:将两个集合中共同存在的成员组成的一个新的集合
补集:属于一个集合而不属于另一个集合的成员组成的新的集合
集合的实现
集合(Set)的实现我们这里基于数组,用数组来存储数据,根据我们之前学习的以及上面提到的一些方法,我们可以将集合的构造函数定义如下(为了区别ES6的 set 类型,我们这里选择用 MySet 命名):

  1. //构造函数
  2. function MySet () {
  3. this.dataStore = []; // 数据存储
  4. this.add = add; // 添加成员
  5. this.remove = remove; // 删除成员
  6. this.size = size; // 集合元素个数
  7. this.union = union; // 集合求并集
  8. this.intersect = intersect; // 集合求交集
  9. this.subset = subset; // 判断一个集合是否是另一集合的子集
  10. this.difference = difference; // 集合求补集
  11. this.contains = contains; // 判断某成员是否属于该集合
  12. this.show = show; // 显示当前集合
  13. }
  14. 复制代码

我们第一个要实现的方法就是向集合中添加一个成员,即 add 方法

add:向集合中添加一个成员

  1. //添加元素
  2. function add (data) {
  3. //判断元素是否存在集合当中
  4. if( this.dataStore.indexOf( data ) < 0 ){
  5. this.dataStore.push(data);
  6. return true;
  7. }else{
  8. console.warn( 'Can not add ' + data + ', must already be in set');
  9. return false;
  10. }
  11. }
  12. 复制代码

我们之前提到,集合中的元素是独一无二的,因此,我们在将数据存储到数组之前,首先就是要确保该集合不存在该数据,因此,我们先用 indexOf 方法检查新加入的元素是否存在,如果找到了就返回该成员在数组中的位置;否则,就返回 -1 ,那么对应的 add 方法就可以定义返回布尔值,添加成功我们返回 true , 否则返回 false ,这样就可以明确告诉我们是否正确的插入了一个元素。

remove:删除集合中某个成员

  1. //删除元素
  2. function remove (data) {
  3. //判断元素是否存在集合当中
  4. var pos = this.dataStore.indexOf(data);
  5. if( pos > -1 ){
  6. this.dataStore.splice(pos,1);
  7. return true;
  8. }else{
  9. console.warn( data + ' is not in set');
  10. return false;
  11. }
  12. }
  13. 复制代码

这里,我们顺理成章的实现了删除方法,它跟 add 方法很类似,首先要检查待删除元素是否存在于数组中,如果存在,我们调用数组的 splice() 方法删除该元素并返回 true ,否则,直接返回 false ,表示集合中不存在该元素。

现在,我们可以完成集合的添加和删除,要测试这些方法之前,我们首先得定义 show 方法,该方法用来显示集合中的成员,该方法的实现很简答,只需返回我们定义的数组即可:

show:显示集合中的成员

  1. // 显示集合成员
  2. function show(){
  3. console.log(this.dataStore);
  4. return this.dataStore;
  5. }
  6. 复制代码

接着,我们这会来测试一下:

  1. var fruits = new MySet();
  2. // 添加成员
  3. fruits.add('Apple');
  4. fruits.add('Banana');
  5. fruits.add('Pear');
  6. fruits.show(); // ["Apple", "Banana", "Pear"]
  7. // 添加重复成员
  8. fruits.add('Apple'); // Can not add Apple, must already be in set
  9. // 删除成员
  10. fruits.remove('Banana');
  11. fruits.show(); // ["Apple", "Pear"]
  12. // 删除不存在的成员
  13. fruits.remove('Banana'); // Banana is not in set
  14. 复制代码

嗯,一切正常,我们可以来实现集合的一些高级操作了,我们先来看看 union (并集)的实现。

union:求集合并集

求集合的并集,就是要将两个集合合并成一个,并除去重复的元素,我们实现思路就是将第一个集合成员放到一个临时集合中,判断第二个集合的成员是否也属于第一个集合,如果为真,代表为重复元素,我们直接跳过该成员,否则将该成员加入临时集合,最后返回该集合即可;

那么,问题来了,我们要如何判断一个成员是否存在于该集合中?因此,我们需要一个辅助方法 contains(),它的实现也非常简单,直接用 indexOf 判断即可

  1. //判断元素是否属于该集合
  2. function contains (data) {
  3. if( this.dataStore.indexOf(data) > -1 ){
  4. return true;
  5. }else{
  6. return false;
  7. }
  8. }
  9. 复制代码

现在,我们可以定义 union 方法了

  1. //求集合的并集
  2. function union ( set ) {
  3. var tempSet = new MySet();
  4. for( var i = 0 ; i < this.dataStore.length ; i++ ){
  5. tempSet.add(this.dataStore[i]);
  6. }
  7. for( var i = 0 ; i< set.dataStore.length ; i++ ){
  8. if( !tempSet.contains(set.dataStore[i])){
  9. tempSet.dataStore.push(set.dataStore[i]);
  10. }
  11. }
  12. return tempSet;
  13. }
  14. 复制代码

这样,我们就可以就集合的并集了,

  1. var fruits1 = new MySet();
  2. fruits1.add('Apple');
  3. fruits1.add('Banana');
  4. fruits1.add('Pear');
  5. var fruits2 = new MySet();
  6. fruits2.add('Grape');
  7. fruits2.add('Banana');
  8. fruits2.add('Pear');
  9. fruits2.add('Orange');
  10. var union = fruits1.union( fruits2 );
  11. union.show(); // ["Apple", "Banana", "Pear", "Grape", "Orange"]
  12. 复制代码

成功了!我们可以来看看求集合的交集了。

intersect:求集合的交集

有了上面求并集的思路,那么交集的定义来说也相对简单,思路就是发现第一个集合的成员也属于第二个集合时,就将该成员加入到新的集合,最后返回新的集合即可;

  1. //求集合的交集
  2. function intersect (set) {
  3. var tempSet = new MySet();
  4. for(var i = 0 ; i < this.dataStore.length ; i++ ){
  5. if( set.contains(this.dataStore[i])){
  6. tempSet.add(this.dataStore[i]);
  7. }
  8. }
  9. return tempSet;
  10. }
  11. 复制代码

我们还是利用上面的两个集合接着求其交集:

  1. var intersect = fruits1.intersect( fruits2 );
  2. intersect.show(); // ["Banana", "Pear"]
  3. 复制代码

下一个定义的操作是 subset ;

subset:判断集合是否是另一集合的子集

该方法首先要确定 该集合的长度是否小于待比较的集合。如果该集合比待比较集合还要大,那么肯定不是待比较集合的一个子集。只要当,待比较集合比较大时,才去判断集合类的成员是否都属于待比较集合,如果有一个不是,直接返回 false , 只有当所有元素都属于待比较集合的时候,我们才能说该集合是待比较集合的一个子集,该方法才会返回 true , 为了方便查看,我加入了console打印;

  1. //子集判断
  2. function subset (set) {
  3. if( this.size() > set.size() ){
  4. console.log('not a subset');
  5. return false;
  6. }else{
  7. for ( var i = 0 ; i < this.dataStore.length ; i++ ){
  8. if( !set.contains(this.dataStore[i])){
  9. console.log('not a subset');
  10. return false;
  11. }
  12. }
  13. }
  14. console.log(' a subset');
  15. return true;
  16. }
  17. 复制代码

我们看到上面用到了 size 方法,它的定义如下:

  1. //返回集合长度
  2. function size () {
  3. return this.dataStore.length;
  4. }
  5. 复制代码

我们保留上面的 fruits1 和 fruits2 , 新建一个 fruits3 来演示 subset 方法

  1. var fruits3 = new MySet();
  2. fruits3.add('Apple');
  3. fruits3.add('Banana');
  4. fruits3.add('Pear');
  5. fruits3.add('Grape');
  6. fruits3.add('Orange');
  7. //子集判断
  8. fruits1.subset( fruits2 ); // not a subset
  9. fruits2.subset( fruits2 ); // a subset
  10. fruits1.subset( fruits3 ); // a subset
  11. 复制代码

看起来一切都很顺利,我们只剩最后一个 difference 方法,该方法返回一个新集合,该集合是由属于第一个集合而不属于第二个集合的成员组成的。

difference:补集

有了交集的思路,补集的实现就显得很自然了。

  1. //补集
  2. function difference (set) {
  3. var tempSet = new MySet();
  4. for( var i = 0 ; i < this.dataStore.length ; i ++ ){
  5. if( !set.contains(this.dataStore[i])){
  6. tempSet.dataStore.push( this.dataStore[i] );
  7. }
  8. }
  9. return tempSet;
  10. }
  11. 复制代码

我们测试一下:

  1. fruits1.difference(fruits2).show(); // ['Apple']
  2. fruits1.difference(fruits3).show(); // []
  3. fruits2.difference(fruits1).show(); // ["Grape", "Orange"]
  4. 复制代码

到现在,我们完成了一个完整的 set 集合!

本篇介绍的集合和 ES6 的集合略微有点差别,ES6 提供的 Set 数据结构,有很多现成的方法可以直接调用获~

如果你觉得这篇文章对你有点用的话,麻烦请给我们的开源项目点点star: http://github.crmeb.net/u/defu 不胜感激 !

发表评论

表情:
评论列表 (有 0 条评论,317人围观)

还没有评论,来说两句吧...

相关阅读

    相关 算法数据结构集合

    重点知识 1. 在各种查找方法中,平均查找长度与结点个数n无关的查找方法是哈希查找。 2. 动态查找表和静态查找表的重要区别在于前者包含有插入和删除运算,而后者不包含这

    相关 python set集合数据结构

    `set`(集合)是一个非常有用的数据结构。它与列表(`list`)的行为类似,区别在于`set`不能包含重复的值。 这在很多情况下非常有用。例如你可能想检查列表中是否包含