Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1793822
  • 博文数量: 438
  • 博客积分: 9799
  • 博客等级: 中将
  • 技术积分: 6092
  • 用 户 组: 普通用户
  • 注册时间: 2012-03-25 17:25
文章分类

全部博文(438)

文章存档

2019年(1)

2013年(8)

2012年(429)

分类: Java

2012-03-25 23:50:23

Java容器分为两大类CollectionMap,它们分别对应着两个接口。我们先来研究Collection这一大类。

Collection又分为三类ListSetQueue,它们三个同样对应着三个接口。看一下Collection接口的定义:


  1. interface Collection<T> {
  2.     boolean add(T e);
  3.     boolean addAll(Collection<? extends T> c);
  4.     void clear();
  5.     boolean contains(Object o);
  6.     boolean containsAll(Collection<?> c);
  7.     boolean isEmpty();
  8.     Iterator<T> iterator();
  9.     boolean remove(Object o);
  10.     boolean removeAll(Collection<?> c);
  11.     boolean retainAll(Collection<?> c);
  12.     int size();
  13.     Object[] toArray();
  14.     <T> T[] toArray(T[] a);
  15. }

这些方法从字面上看都很理解。其中retainAll与removeAll相对,只保留参数中的元素。同时它还可以返回一个迭代器Iterator

再看看List接口的定义:


  1. interface List<T> extends Collection<T> {
  2.     void add(int index, T element);
  3.     boolean addAll(int index, Collection<? extends T> c);
  4.     T get(int index);
  5.     int indexOf(Object o);
  6.     int lastIndexOf(Object o);
  7.     ListIterator<T> listIterator();
  8.     ListIterator<T> listIterator(int index);
  9.     T remove(int index);
  10.     T set(int index, T element);
  11.     List<T> subList(int fromIndex, int toIndex);
  12. }

List加入了对index的支持。同时它还可以另一个迭代器类型ListIterator

接下来是Set接口的定义:


  1. interface Set<T> extends Collection<T> {
  2. }

它没有加入任何新的方法。

还有Queue接口的定义:


  1. interface Queue<T> extends Collection<T> {
  2.     T element();
  3.     boolean offer(T e);
  4.     T peek();
  5.     T poll();
  6.     T remove();
  7. }

element方法和peek方法都是获取队首元素,不同的是当队列为空是element抛出异常(NoSuchElementException)而peek返回null。pollremove都是返回并删除队首元素,当队列为空时remove抛出异常而poll返回null。offer方法类似于add。它在不违反队列容量限制的情况下试图插入一个元素,不成功的话返回false而不抛出异常(add方法会抛出异常IllegalStateException)。


虽然这些接口定义了各种方法,但实现它们的类并不必支持这些方法。实现接口的类在方法的实现中抛出UnSupportedOperationException来表示它不支持该方法。比如一个ArrayList的长度是可以变化的,但是如果由Arrays.asList()得到的话,那它就不再支持改变长度的方法了:


  1. List<Integer> arrayAsList = Arrays.asList(1, 3, 5);
  2. List<Integer> modifiableList = new ArrayList<Integer>(arrayAsList);
  3. modifiableList.clear(); // success!
  4. arrayAsList.set(2, 3); // success! Able to change an element
  5. arrayAsList.clear(); // UnsupportedOperationException: cannot change the size

UnSupportedOperationException是一个RuntimeException,它表示一个编程错误,其实和C++里的Assert一样。Collections.unmodifiableList方法会得到一个只读的List:
  1. List<Integer> unmodifiableList = Collections.unmodifiableList(modifiableList);
  2. unmodifiableList.set(2, 3); // UnsupportedOperationException: cannot modify the list

Collections.unmodifiableList返回的其实是一个内部类Collections$UnmodifiableRandomAccessList的一个实例。

相应的,Collections.synchronizedCollectionCollections.synchronizedListCollections.synchronizedMapCollections.synchronizedSetCollections.synchronizedSortedMapCollections.synchronizedSortedSet会返回支持线程同步的容器。它们也都是Collections的内部类。


每种类型的接口都有一个Abstract类的实现,比如Collection接口被AbstractCollection实现。AbstractCollection实现了Collection里绝大多数的方法,除了iterator()方法和size()方法。那些被实现的方法仅仅是抛出一个UnSupportedOperationException。Abstract容器类存在的价值在于,当你需要写一个容器类,可以继承自这个Abstract容器类并覆盖你仅需要支持的方法,其它的不需要支持的方法可以继续抛出异常。这样你就不必耗费大量精力去实现容器接口的所有方法。相应的,你还可以发现AbstractListAbstractSetAbstractMap等Abstract容器类。Java类库里所有的具体容器类都继承自某个Abstract容器类。


现在来看看Iterator类。一个Collection都会返回一个Iterator用于遍历这个容器。看看Iterator的定义:


  1. interface Iterator<T> {
  2.     boolean hasNext();
  3.     T next();
  4.     void remove();
  5. }

当要遍历一个容器时,用hasNext判断是否有下一个元素,用next取得下一个元素,如果没有下一个元素next方法会抛出NoSuchElementException。通过remove删除当前元素,删除后当前的元素不再可用。有些Iterator不支持remove,这种情况下这个方法会简单抛出一个UnSupportedOperationException。
一旦容器被修改,之前获得的Iterator就会失效。如果这时还试图访问这个Iterator就会得到异常:
  1. Collection<Integer> c = new ArrayList<Integer>();
  2. c.add(1);
  3. Iterator<Integer> itor = c.iterator();
  4. c.add(3); // modify the collection
  5. if (itor.hasNext())
  6.     itor.next(); // java.util.ConcurrentModificationException

List可以返回一个ListIterator类型。看看它的定义:
  1. interface ListIterator<T> {
  2.     void add(T e);
  3.     boolean hasPrevious();
  4.     int nextIndex();
  5.     T previous();
  6.     int previousIndex();
  7.     void set(T e);
  8. }

可以看到ListIterator支持了向前和向后遍历,同时还支持添加元素和修改当前元素的操作。


实现List接口的类有ArrayListLinkedList。一个用数组实现,另一个用双向链表实现。除了这两个类外,还有早期开发的不再推荐使用的Vector和Stack类。


实现Set接口的类有HashSetTreeSetLinkedHashSet
HashSet用散列的方式存储集合元素。它支持快速查找。放入HashSet的元素必须支持hashCode和equals方法。
LinkedHashSet可以达到HashSet一样的查找速度,同时内部维护了一个链表。当使用跌代器遍历LinkedHashSet时,遍历的顺序和元素插入的顺序一样。放入LinkedHashSet的元素同样需要支持hashCode。
TreeSet使用红黑树实现集合,它对内部元素排序。在遍历元素时按照由小到大的顺序。放入TreeSet的元素必须实现Comparable接口。TreeSet实现了SortedSet接口:


  1. interface SortedSet<T> {
  2.     Comparator<? super T> comparator();
  3.     T first();
  4.     SortedSet<T> headSet(T toElement);
  5.     T last();
  6.     SortedSet<T> subSet(T fromElement, T toElement);
  7.     SortedSet<T> tailSet(T fromElement);
  8. }

first方法返回集合中最小的元素。last返回最大的元素。headSet、subSet和tailSet返回子集。

实现Queue接口的类有LinkedListPriorityQueue
其实LinkedList同时实现了List接口和Deque接口。Deque是双向队列:


  1. interface Deque<T> extends Queue<T> {
  2.     void addFirst(T e);
  3.     void addLast(T e);
  4.     Iterator<T> descendingIterator();
  5.     T getFirst();
  6.     T getLast();
  7.     boolean offerFirst(T e);
  8.     boolean offerLast(T e);
  9.     T peekFirst();
  10.     T peekLast();
  11.     T pollFirst();
  12.     T pollLast();
  13.     T pop();
  14.     void push(T e);
  15.     T removeFirst();
  16.     boolean removeFirstOccurrence(Object o);
  17.     T removeLast();
  18.     boolean removeLastOccurrence(Object o);
  19. }

PriorityQueue根据优先级确定下一个移出对列的元素。放入PriorityQueue的元素需要实现Comparable接口,最小的元素会先在队首。看下面的示例代码:
  1. PriorityQueue<Integer> pq = new PriorityQueue<Integer>();
  2. pq.offer(5);
  3. pq.offer(13);
  4. pq.offer(9);
  5. pq.offer(12);
  6. pq.offer(6);
  7. while (!pq.isEmpty()) {
  8.     System.out.println(pq.poll()); // 5, 6, 9, 12, 13
  9. }


接下来看看Map接口的定义:


  1. interface Map<K, V> {
  2.     void clear();
  3.     boolean containsKey(Object key);
  4.     boolean containsValue(Object value);
  5.     Set<java.util.Map.Entry<K, V>> entrySet();
  6.     V get(Object key);
  7.     boolean isEmpty();
  8.     Set<K> keySet();
  9.     V put(K key, V value);
  10.     void putAll(Map<? extends K, ? extends V> m);
  11.     V remove(Object key);
  12.     int size();
  13.     Collection<V> values();
  14. }

注意到entrySet方法返回一个Map.Enry的集合。Map.Entry也是一个接口:
  1. interface Map.Entry<K, V> {
  2.     K getKey();
  3.     V getValue();
  4.     V setValue(V value);
  5. }

还可以看到Map通过values方法转成一个Collection类型。


实现Map接口的类有HashMapLinkedHashMapTreeMapWeakHashMapConcurrentHashMapIdentityHashMap等。
其实可以把Map看成特殊的Collection。Collection里的元素是一个value而Map里的元素是一个键值对(Entry)。从这种角度看HashMapLinkedHashMapTreeMap与HashSet、LinkedHashSet和TreeSet其实大同小异。其中TreeMap同样也实现了一个SortedMap的接口,它和SortedSet很相似:
  1. interface SortedMap<K,V> extends Map<K,V> {
  2.     Comparator<? super K> comparator();
  3.     K firstKey();
  4.     SortedMap<K, V> headMap(K toKey);
  5.     K lastKey();
  6.     SortedMap<K, V> subMap(K fromKey, K toKey);
  7.     SortedMap<K, V> tailMap(K fromKey);
  8. }

WeakHashMap里的某个键如果没有在Map外被引用时,这个键会被垃圾回收器回收并且该键的条目会从Map中删除。这个键其实是一个弱引用,即它不会增加对所引用对象的计数。
ConcurrentHashMap是一种线程安全的Map,它不涉及同步加锁。
IdentityHashMap在比较键值时是调用“==”操作符,而不是对象的equals方法。


说到WeakHashMap里的弱引用,我们来研究下java里的引用对象(reference object)。在java.lang.ref包里有一个Reference对象。它有三个子类SoftReference,WeakReferencePhantomReference

通常情况一 下,我们用new创建一个对象并把它赋给一个引用,这个引用是一个强引用(Strong Reference)。比如“Object o = new Integer(3);”里的“o”就是一个强引用。垃圾回收器是绝对不会释放一个强引用所引用的对象的。

软引用(soft reference)比强引用的程度稍弱些。一般情况下,垃圾回收器是不会清理软引用所引用的对象的,看这个例子:


  1. class MyClass {
  2.     protected void finalize() {
  3.         System.out.println("MyClass.finalize");
  4.     }
  5. }

  6. // caller
  7. MyClass mc = new MyClass();
  8. SoftReference sr = new SoftReference(mc, rq);
  9. mc = null; // free the strong reference!!
  10. System.gc(); // output: nothing.

当使用System.gc强行清理垃圾的时候,软引用所引用的对象并不会被清理。但如果内存不够的情况下,被软引用的对象就会被清理掉:
  1. // caller
  2. MyClass mc = new MyClass();
  3. SoftReference sr = new SoftReference(mc, rq);
  4. mc = null;

  5. // now try to use out the memory
  6. ArrayList al = new ArrayList();
  7. while (true)
  8.     al.add(new int[204800]);
  9. // output: MyClass.finalize
  10. // output: java.lang.OutOfMemoryError

可以看到在抛出异常前,虚拟机把软引用所指的对象清理掉了。软引用的这样的特性特别适合作为内存的Cache。

弱引用(Weak reference)要比软引用的程度还弱些。如果某对象没有被强引用或软引用,而只是被弱引用,垃圾回收器会清理掉这个对象:


  1. MyClass mc = new MyClass();
  2. WeakReference wr = new WeakReference(mc);
  3. mc = null; // free the strong reference!!
  4. System.gc(); // output: MyClass.finalize

虚引用(Phantom reference)不干涉对象的生命周期,它只保证当它所引用的对象被清理时,虚引用本身被放进一个ReferenceQueue里。


  1. ReferenceQueue rq = new ReferenceQueue();
  2. MyClass mc = new MyClass();
  3. PhantomReference pr = new PhantomReference(mc, rq);
  4. mc = null;
  5. System.gc();
  6.     
  7. Reference r = null;
  8. try {
  9.     r = rq.remove();
  10. } catch (InterruptedException e) {
  11.     e.printStackTrace();
  12. }
  13. if (r != null)
  14.     System.out.println("You die!!!");

当被虚引用的对象被gc回收时,gc会把PhantomReference放入ReferenceQueue里。由于finalize方法的不可靠,虚引用可以更好地保证一些清理工作。


最后介绍一个很节省存储空间的容器BitSet。它的每个元素是一个位,你可以设置它的各个位,并且可以进行与或操作等。BitSet的最小size是64位。下面给出一个例子:


  1. void print(BitSet bs) {
  2.     for (int i = 0; i < bs.size(); ++i)
  3.         System.out.print(bs.get(i) ? '1' : '0');
  4.     System.out.println();
  5. }
  6. // caller
  7. BitSet bs1 = new BitSet();
  8. bs1.set(2, 15);
  9. print(bs1); // 0011111111111110000000000000000000000000000000000000000000000000
  10. bs1.set(4, false);
  11. print(bs1); // 0011011111111110000000000000000000000000000000000000000000000000
  12. BitSet bs2 = new BitSet();
  13. bs2.set(8, 27);
  14. print(bs2); // 0000000011111111111111111110000000000000000000000000000000000000
  15. bs2.and(bs1);
  16. print(bs2); // 0000000011111110000000000000000000000000000000000000000000000000

阅读(976) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~