java集合类主要分为以下三类:
第一类:Array、Arrays
第二类:Collection
:List、Set
第三类:Map
:HashMap、HashTable
一、Array , Arrays
Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。
1、
效率高,但容量固定且无法动态改变。
array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。
2、Java中有一个Arrays类,专门用来操作array
。
arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy():array的复制。
二、Collection , Map
若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。
1、Collection 和 Map 的区别
容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。
2、各自旗下的子类关系
Collection
--List
:
将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
--ArrayList / LinkedList /
Vector
--Set
: 不能含有重复的元素
--HashSet / TreeSet
Map
--HashMap
--
HashTable
--
TreeMap
3、其他特征
*
List,Set,Map将持有对象一律视为Object型别。
* Collection、List、Set、Map都是接口,不能实例化。
继承自它们的 ArrayList, Vector,
HashTable, HashMap是具象class,这些才可被实例化。
*
vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。
三、Collections
Collections是针对集合类的一个帮助类。
提供了一系列静态
方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list); 对list中元素排序
四、如何选择?
1、容器类和Array的区别、择取
*
容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
*
一旦将对象置入容器内,便损失了该对象的型别信息。
2、
*
在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
Vector总是比ArrayList慢,所以要尽量避免使用。
*
在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
HashTree存在的唯一理由:能够维护其内元素的排序状态。
* 在各种Maps中
HashMap用于快速查找。
*
当元素个数固定,用Array,因为Array效率是最高的。
结论:最常用的是ArrayList,HashSet,HashMap,Array。
注意:
1、Collection没有get()方法
来取得某个元素。只能通过iterator()遍历元素。
2、Set
和Collection拥有一模一样的接口。
3、List
,可以通过get()方法来一次取出一个元素
。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue
。
5、Map用 put(k,v) /
get(k)
,还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
HashMap会利用对象的hashCode来快速找到key。
*
hashing
哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。
6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()
抽取key序列,将map中的所有keys生成一个Set。
使用values(
)
抽取value序列,将map中的所有values生成一个Collection。
为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。
array专题一:数组(array)与ArrayList的主要区别:效率、类型识别和primitive type。
1.自己的总结:
1)精辟阐述:(《TIJ》第323页)
初学者可以将ArrayList想象成一种“会自动扩增容量的array”。
2)array([]):最高效;但是其容量固定且无法动态改变;
ArrayList:容量可动态增长;但牺牲效率;
3)建议:(《TIJ》第292页)
基于效率和类型检验,应尽可能使用array,无法确定数组大小时才使用ArrayList!
不过当你试着解决更一般化的问题时,array的功能就可能过于受限。
4)java
中一切皆对象,array也是对象。不论你所使用得array型别为何,array名称本身实际上是个reference,指向heap之内得某个实际对
象。这个对象可经由“array初始化语法”被自动产生,也可以以new表达式手动产生。(《TIJ》第292页)
5)array可做为函数返回值,因为它本身是对象的reference;(《TIJ》第295页)
6)对象数组与基本类型数组在运用上几乎一模一样,唯一差别在于,前者持有得是reference,后者直接持有基本型别之值;(《TIJ》第292页)
eg.
Employee[] staff=new Employee[100];
int[] num=new int[10];
7)容器所持有的其实是一个个reference指向Object,进而才能存储任意型别。当然这不包括基本型别,因为基本型别并不继承自任何classes。(《TIJ》第323页)
8)
面对array,我们可以直接持有基本型别数值的array(eg.int[]
num;),也可以持有reference(指向对象)的array;但是容器类仅能持有reference(指向对象),若要将基本型别置于容器内,需
要使用wrapper类。但是wrapper类使用起来可能不很容易上手,此外,primitives
array得效率比起“容纳基本型别之外覆类(的reference)”的容器好太多了。
当然,如果你的操作对象是基本型别,而且需要在空间不足时自动扩增容量,array便不适合,此时就得使用外覆类的容器了。
(《TIJ》第295页)
自己的注释:
jdk5可以自动装包和解包,似乎感觉不到外覆类的存在了。
9)某些情况下,容器类即使没有转型至原来的型别,仍然可以运作无误。有一种情况尤其特别:编译器对String class提供了一些额外的支持,使它可以平滑运作。(《TIJ》第325页)
10)你可能会认为应该针对各种基本类型都提供一份特殊版的ArrayList,但java并未如此。有朝一日,某种模板机制也许能帮助java更妥善的处理此一问题。(《TIJ》第295页)
自己的注释:
jdk5已经支持泛型,相当于不仅可以“针对各种基本类型都提供一份特殊版的ArrayList”,并且可以“针对所有型别(包括用户自定义的类,如Employee类)都提供一份特殊版的ArrayList”。
这样,“不能识别型别”已经不再ArrayList的劣势,把不正确的对象置于容器内就会发生编译器错误;而不像以前那样编译期不发生错误,执行期才产生异常,可能会产生难以查觉的程序臭虫。
此外,泛型支持的实现原理可以从“《TIJ》第326页”的“制作一个具有型别意识的ArrayList”的例子中领悟到一二。
11)对数组的一些基本操作,像排序、搜索与比较等是很常见的。因此在Java中提供了Arrays类协助这几个操作:sort(),binarySearch(),equals(),fill(),asList().
(《Java JDK 5.0学习笔记》)
自己的注释:
不过Arrays类没有提供删除方法,而ArrayList中有remove()方法,不知道是否是不需要在array中做删除等操作的原因(因为此时应该使用链表)。
12)ArrayList的使用也很简单:产生ArrayList,利用add()将对象置入,利用get(i)配合索引值将它们取出。这一切就和array的使用方式完全相同,只不过少了[]而已。(《TIJ》第323页)
2.参考资料:
1)效率:
数组扩容是对ArrayList效率影响比较大的一个因素。
每
当执行Add、AddRange、Insert、InsertRange等添加元素的方法,都会检查内部数组的容量是否不够了,如果是,它就会以当前容量
的两倍来重新构建一个数组,将旧元素Copy到新数组中,然后丢弃旧数组,在这个临界点的扩容操作,应该来说是比较影响效率的。
ArrayList是Array的复杂版本
ArrayList内部封装了一个Object类型的数组,从一般的意义来说,它和数组没有本质的差别,甚至于ArrayList的许多方法,如Index、IndexOf、Contains、Sort等都是在内部数组的基础上直接调用Array的对应方法。
2)类型识别:
ArrayList存入对象时,抛弃类型信息,所有对象屏蔽为Object,编译时不检查类型,但是运行时会报错。
注:jdk5中加入了对泛型的支持,已经可以在使用ArrayList时进行类型检查。
从这一点上看来,ArrayList与数组的区别主要就是由于动态增容的效率问题了
3)ArrayList可以存任何Object,如String,Employee等,但不支持基本数据类型,除非使用wrapper。