【转】Java基本概念：集合类 List/Set/Map...的区别-escarp-ChinaUnix博客

玄冬aigo.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

escarp

博客访问： 1752392
博文数量： 347
博客积分： 9328
博客等级：中将
技术积分： 2680
用户组：普通用户
注册时间： 2010-07-29 23:45

文章分类

全部博文（347）

网络架设（0）
Toos（2）
Android（22）
Web（1）
Benchmark（2）
Architecture（0）
RIA（6）
C#（1）
Build（4）
DB（12）
其他（5）
健康相关（2）
VersionControl（7）
Application（1）
收藏文章（15）
资料收集（7）
Oracle（2）
Algorithm（4）
小点滴（6）
IT网摘（8）
DeveEnv（38）
Graphics（8）

OpenGLES（1）

DirectX（5）

OpenGL（2）
Network（12）
Java（39）

错误处理（3）

Java优化（5）

IDE相关（0）

Java基础（1）

JVM（2）
Linux（24）
UNIX（8）
C++（110）

ACE（1）

GDI（1）

MFC（1）

Boost（1）

STL（4）
未分配的博文（1）

文章存档

2016年（1）

2013年（4）

2012年（207）

2011年（85）

2010年（50）

我的朋友

相关博文

【转】Java基本概念：集合类 List/Set/Map...的区别

分类： Java

2010-12-24 23:51:39

原文： http://dev.firnow.com/course/3_program/java/javashl/2008510/115078.html

Java^TM 2 Platform
Standard Ed. 5.0

在JAVA的util包中有两个所有集合的父接口Collection和Map,它们的父子关系：

           java.util
        +Collection 这个接口extends自 --java.lang.Iterable接口
           +List 接口
              -ArrayList 类
              -LinkedList 类
              -Vector 类     此类是实现同步的

+Queue 接口
+不常用，在此不表.

           +Set 接口
              +SortedSet 接口
                 -TreeSet 类
              -HashSet

        +Map 接口
          -HashMap 类 (除了不同步和允许使用 null 键/值之外,与 Hashtable 大致相同.)
          -Hashtable 类此类是实现同步的,不允许使用 null 键值
          +SortedMap 接口
             -TreeMap 类

以下对众多接口和类的简单说明：首先不能不先说一下数组（Array）
一、Array ， Arrays

Java所有“存储及随机访问一连串对象”的做法，array是最有效率的一种。

1、
效率高，但容量固定且无法动态改变。
array还有一个缺点是，无法判断其中实际存有多少元素，length只是告诉我们array的容量。

2、Java中有一个Arrays类，专门用来操作array。
arrays中拥有一组static函数，
equals()：比较两个array是否相等。array拥有相同元素个数，且所有对应元素两两相等。
fill()：将值填入array中。
sort()：用来对array进行排序。
binarySearch()：在排好序的array中寻找元素。
System.arraycopy()：array的复制。

二、Collection ， Map

若撰写程序时不知道究竟需要多少对象，需要在空间不足时自动扩增容量，则需要使用容器类库，array不适用。

1、Collection 和 Map 的区别

容器内每个为之所存储的元素个数不同。
Collection类型者，每个位置只有一个元素。
Map类型者，持有 key-value pair，像个小型数据库。

2、Java2容器类类库的用途是“保存对象”，它分为两类，各自旗下的子类关系

Collection
       --List：将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
             --ArrayList / LinkedList / Vector
       --Set ：不能含有重复的元素
             --HashSet /TreeSet
Map
       --HashMap
    --HashTable
    --TreeMap

　Map----一组成对的“键值对”对象，即其元素是成对的对象，最典型的应用就是数据字典，并且还有其它广泛的应用。另外，Map可以返回其所有键组成的Set和其所有值组成的Collection，或其键值对组成的Set，并且还可以像数组一样扩展多维Map，只要让Map中键值对的每个“值”是一个Map即可。

　Collection下 1.迭代器

　　迭代器是一种设计模式，它是一个对象，它可以遍历并选择序列中的对象，而开发人员不需要了解该序列的底层结构。迭代器通常被称为“轻量级”对象，因为创建它的代价小。

　　Java中的Iterator功能比较简单，并且只能单向移动：

　　(1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iterator的next()方法时，它返回序列的第一个元素。注意：iterator()方法是java.lang.Iterable接口,被Collection继承。

　　(2) 使用next()获得序列中的下一个元素。

　　(3) 使用hasNext()检查序列中是否还有元素。

　　(4) 使用remove()将迭代器新返回的元素删除。

　　Iterator是Java迭代器最简单的实现，为List设计的ListIterator具有更多的功能，它可以从两个方向遍历List，也可以从List中插入和删除元素。

　　2.List的功能方法

　　List(interface): 次序是List最重要的特点；它确保维护元素特定的顺序。List为Collection添加了许多方法，使得能够向List中间插入与移除元素(只推荐LinkedList使用)。一个List可以生成ListIterator，使用它可以从两个方向遍历List，也可以从List中间插入和删除元素。

　　ArrayList: 由数组实现的List。它允许对元素进行快速随机访问，但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历ArrayList，而不是用来插入和删除元素，因为这比LinkedList开销要大很多。

　　LinkedList: 由列表实现的List。对顺序访问进行了优化，向List中间插入与删除得开销不大，随机访问则相对较慢(可用ArrayList代替)。它具有方法addFirst()、addLast()、getFirst()、getLast()、removeFirst()、removeLast()，这些方法(没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。

　　3.Set的功能方法

　　Set(interface): 存入Set的每个元素必须是唯一的，这也是与List不同的，因为Set不保存重复元素。加入Set的Object必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。

　　HashSet: HashSet能快速定位一个元素，存入HashSet的对象必须定义hashCode()。

　　TreeSet: 保持次序的Set，底层为树结构。使用它可以从Set中提取有序的序列。

　　LinkedHashSet: 具有HashSet的查询速度，且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时，结果会按元素插入的次序显示。

　　HashSet采用散列函数对元素进行排序，这是专门为快速查询而设计的；TreeSet采用红黑树的数据结构进行排序元素；LinkedHashSet内部使用散列以加快查询速度，同时使用链表维护元素的次序，使得看起来元素是以插入的顺序保存的。需要注意的是，生成自己的类时，Set需要维护元素的存储顺序，因此要实现Comparable接口并定义compareTo()方法。

3、其他特征

*     List，Set，Map将持有对象一律视为Object型别。
*     Collection、List、Set、Map都是接口，不能实例化。
      继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class，这些才可被实例化。
*     vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。

三、Collections

Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如，Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list); 对list中元素排序

四、如何选择？

1、容器类和Array的区别、择取
* 容器类仅能持有对象引用（指向对象的指针），而不是将对象信息copy一份至数列某位置。
* 一旦将对象置入容器内，便损失了该对象的型别信息。

2、
     *     在各种Lists中，最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时，使用LinkedList()；
        Vector总是比ArrayList慢，所以要尽量避免使用。
     *     在各种Sets中，HashSet通常优于HashTree（插入、查找）。只有当需要产生一个经过排序的序列，才用TreeSet。
        HashTree存在的唯一理由：能够维护其内元素的排序状态。
     *     在各种Maps中
        HashMap用于快速查找。
     *     当元素个数固定，用Array，因为Array效率是最高的。

结论：最常用的是ArrayList，HashSet，HashMap，Array。而且，我们也会发现一个规律，用TreeXXX都是排序的。

注意：

1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List，可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个，get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。

5、Map用 put(k,v) / get(k)，还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
      HashMap会利用对象的hashCode来快速找到key。
    *     hashing
          哈希码就是将对象的信息经过一些转变形成一个独一无二的int值，这个值存储在一个array中。
          我们都知道所有存储结构中，array查找速度是最快的。所以，可以加速查找。

          发生碰撞时，让array指向多个values。即，数组每个位置上又生成一个梿表。

6、Map中元素，可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列，将map中的所有keys生成一个Set。
使用values()抽取value序列，将map中的所有values生成一个Collection。

为什么一个生成Set，一个生成Collection？那是因为，key总是独一无二的，value允许重复。

阅读(1788) | 评论(0) | 转发(0) |

上一篇：【转】再谈重入锁--ReentrantLock

下一篇：【转】Notepad++ 中文查找(中文搜索)问题解决方法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6