Chinaunix首页 | 论坛 | 博客
  • 博客访问: 4608310
  • 博文数量: 1214
  • 博客积分: 13195
  • 博客等级: 上将
  • 技术积分: 9105
  • 用 户 组: 普通用户
  • 注册时间: 2007-01-19 14:41
个人简介

C++,python,热爱算法和机器学习

文章分类

全部博文(1214)

文章存档

2021年(13)

2020年(49)

2019年(14)

2018年(27)

2017年(69)

2016年(100)

2015年(106)

2014年(240)

2013年(5)

2012年(193)

2011年(155)

2010年(93)

2009年(62)

2008年(51)

2007年(37)

分类: Java

2012-03-24 01:35:59

文章来源:http://blog.csdn.net/blacksource/article/details/4380353
http://www.blogjava.net/flysky19/articles/93467.html

java集合类主要分为以下三类:

第一类:Array、Arrays

第二类:Collection :List、Set
第三类:Map :HashMap、HashTable

 

一、Array , Arrays

Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

1、
效率高,但容量固定且无法动态改变。
array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

2、Java中有一个Arrays类,专门用来操作array
    arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy():array的复制。


二、Collection , Map

若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。

1、Collection 和 Map 的区别

容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。

2、各自旗下的子类关系

Collection
    --List : 将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
          --ArrayList / LinkedList / Vector
    --Set : 不能含有重复的元素
          --HashSet / TreeSet
Map
    --HashMap
    -- HashTable
    -- TreeMap

3、其他特征

*  List,Set,Map将持有对象一律视为Object型别。
*  Collection、List、Set、Map都是接口,不能实例化。
   继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。
*  vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。


三、Collections

Collections是针对集合类的一个帮助类。 提供了一系列静态 方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
    Collections.sort(List list); 对list中元素排序

四、如何选择?

1、容器类和Array的区别、择取
   *  容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
   *  一旦将对象置入容器内,便损失了该对象的型别信息。

2、
  *  在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
     Vector总是比ArrayList慢,所以要尽量避免使用。
  *  在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
     HashTree存在的唯一理由:能够维护其内元素的排序状态。
  *  在各种Maps中
     HashMap用于快速查找。
  *  当元素个数固定,用Array,因为Array效率是最高的。

结论:最常用的是ArrayList,HashSet,HashMap,Array。


注意:

1、Collection没有get()方法 来取得某个元素。只能通过iterator()遍历元素。
2、Set 和Collection拥有一模一样的接口。
3、List可以通过get()方法来一次取出一个元素 。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue

5、Map用 put(k,v) / get(k) ,还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
   HashMap会利用对象的hashCode来快速找到key。
    *  hashing
       哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
       我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
      
       发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。

6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet() 抽取key序列,将map中的所有keys生成一个Set。
使用values( ) 抽取value序列,将map中的所有values生成一个Collection。

为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。


array专题一:数组(array)与ArrayList的主要区别:效率、类型识别和primitive type。

1.自己的总结:
1)精辟阐述:(《TIJ》第323页)
初学者可以将ArrayList想象成一种“会自动扩增容量的array”。

2)array([]):最高效;但是其容量固定且无法动态改变;
ArrayList:容量可动态增长;但牺牲效率;

3)建议:(《TIJ》第292页)
基于效率和类型检验,应尽可能使用array,无法确定数组大小时才使用ArrayList!

不过当你试着解决更一般化的问题时,array的功能就可能过于受限。

4)java 中一切皆对象,array也是对象。不论你所使用得array型别为何,array名称本身实际上是个reference,指向heap之内得某个实际对 象。这个对象可经由“array初始化语法”被自动产生,也可以以new表达式手动产生。(《TIJ》第292页)

5)array可做为函数返回值,因为它本身是对象的reference;(《TIJ》第295页)

6)对象数组与基本类型数组在运用上几乎一模一样,唯一差别在于,前者持有得是reference,后者直接持有基本型别之值;(《TIJ》第292页)
eg.
Employee[] staff=new Employee[100];
int[] num=new int[10];

7)容器所持有的其实是一个个reference指向Object,进而才能存储任意型别。当然这不包括基本型别,因为基本型别并不继承自任何classes。(《TIJ》第323页)

8) 面对array,我们可以直接持有基本型别数值的array(eg.int[] num;),也可以持有reference(指向对象)的array;但是容器类仅能持有reference(指向对象),若要将基本型别置于容器内,需 要使用wrapper类。但是wrapper类使用起来可能不很容易上手,此外,primitives array得效率比起“容纳基本型别之外覆类(的reference)”的容器好太多了。

当然,如果你的操作对象是基本型别,而且需要在空间不足时自动扩增容量,array便不适合,此时就得使用外覆类的容器了。
(《TIJ》第295页)

自己的注释:
jdk5可以自动装包和解包,似乎感觉不到外覆类的存在了。

9)某些情况下,容器类即使没有转型至原来的型别,仍然可以运作无误。有一种情况尤其特别:编译器对String class提供了一些额外的支持,使它可以平滑运作。(《TIJ》第325页)

10)你可能会认为应该针对各种基本类型都提供一份特殊版的ArrayList,但java并未如此。有朝一日,某种模板机制也许能帮助java更妥善的处理此一问题。(《TIJ》第295页)

自己的注释:
jdk5已经支持泛型,相当于不仅可以“针对各种基本类型都提供一份特殊版的ArrayList”,并且可以“针对所有型别(包括用户自定义的类,如Employee类)都提供一份特殊版的ArrayList”。

这样,“不能识别型别”已经不再ArrayList的劣势,把不正确的对象置于容器内就会发生编译器错误;而不像以前那样编译期不发生错误,执行期才产生异常,可能会产生难以查觉的程序臭虫。

此外,泛型支持的实现原理可以从“《TIJ》第326页”的“制作一个具有型别意识的ArrayList”的例子中领悟到一二。

11)对数组的一些基本操作,像排序、搜索与比较等是很常见的。因此在Java中提供了Arrays类协助这几个操作:sort(),binarySearch(),equals(),fill(),asList().
(《Java JDK 5.0学习笔记》)

自己的注释:
不过Arrays类没有提供删除方法,而ArrayList中有remove()方法,不知道是否是不需要在array中做删除等操作的原因(因为此时应该使用链表)。

12)ArrayList的使用也很简单:产生ArrayList,利用add()将对象置入,利用get(i)配合索引值将它们取出。这一切就和array的使用方式完全相同,只不过少了[]而已。(《TIJ》第323页)

2.参考资料:
1)效率:
数组扩容是对ArrayList效率影响比较大的一个因素。
每 当执行Add、AddRange、Insert、InsertRange等添加元素的方法,都会检查内部数组的容量是否不够了,如果是,它就会以当前容量 的两倍来重新构建一个数组,将旧元素Copy到新数组中,然后丢弃旧数组,在这个临界点的扩容操作,应该来说是比较影响效率的。

ArrayList是Array的复杂版本
ArrayList内部封装了一个Object类型的数组,从一般的意义来说,它和数组没有本质的差别,甚至于ArrayList的许多方法,如Index、IndexOf、Contains、Sort等都是在内部数组的基础上直接调用Array的对应方法。

2)类型识别:
ArrayList存入对象时,抛弃类型信息,所有对象屏蔽为Object,编译时不检查类型,但是运行时会报错。

注:jdk5中加入了对泛型的支持,已经可以在使用ArrayList时进行类型检查。


从这一点上看来,ArrayList与数组的区别主要就是由于动态增容的效率问题了


3)ArrayList可以存任何Object,如String,Employee等,但不支持基本数据类型,除非使用wrapper。


阅读(1881) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~