Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1216947
  • 博文数量: 233
  • 博客积分: 6270
  • 博客等级: 准将
  • 技术积分: 1798
  • 用 户 组: 普通用户
  • 注册时间: 2010-01-26 08:32
文章分类

全部博文(233)

文章存档

2011年(31)

2010年(202)

我的朋友

分类: Java

2010-11-18 10:14:53

     在Java中有许多的容器集合。初一看起来有些糊涂,特别是对刚接触Java来说(至少我当初就是这样的)!其实稍微细心,深入一点点就会发现原来一切都是有规律的。我想别的事情也会是如此。
     Java中的容器,接口都是由一些接口,抽象类及它们的实现类所组成。而它们全部封装在java.util包中。


1:Collection接口
       大多数的集合都实现了此接口,它基本方法是add(没有get()方法,实现类中可能有如Arrylist),添加一对象。添加成功则返回true ,否则返回false。这是与Map不同的地方。还有一些常用的方法如iterator(),size(),toArray()(注:toArray()是返回一对象----object数组,而Arrays----也是java.util下的一个类,有一个asList方法它们通常认为是各集合之间转换的桥梁)等等!具体用法可以参考API文档。

2:Map(映射)接口
       Map接口跟Collection接口实际上没有半点关系。集合中的每一个元素都包含一对键对对象和值对象,集合中没有重复的键对象,值对象可以重复。它的有些实现类能对集合中的键对象进行排序。与Collection截然不同的是,它其中所存取的是一些值与名相对应的数据。也就是一个Key对应一个Value的方式来存储。所以它就有与之对应的一些方法如:put (K key, V value)等等,更多可以参考API文档。

3:List(列表)
     集合中的对象按索引位置排序,可以有重复对象,允许按照对象在集合中的索引位置检索对象

4:Set(集)
     集合中的对象中按特定的方式排序,并且没有重复对象。它的有些实现类能对集合中的对象
按特定的方式排序

5:Iterator(迭代器)接口
     它是一个接口,只有三个方法hasnext(),next(),remove()只有最后一个是可选的,也就是remove()是可选(在实现的时候)。其可选性也意味着它的实现类中,remove方法是可有可无的。例如,若有一个如下的List 实例。
 

Arrylist al = new Arrylist();
    Object[] ob = al.toArray();
    List list = Arrays.asList(ob);
    Iterator itor = list.iterator();
    itor.remove();


      当调用Ierator itr = list.iterator()方法返回一迭代器的时候,便不支持remove方法,所以当你再使用irt.remove()时程序就是异常!

      使用此迭代器要注意的是remove()方法。它所删除的是指指针(暂这么叫着)上次所移经过的位置(Removes from the underlying collection the last element returned by the iterator (optional operation).)。我个人觉得有点象在JDBC中的ResultSet rs = ....;rs.last();rowsCount=rs.getRow();类似呢。
      前面所讲的,由于clollection提供了iterator()方法,所以迭代器是很容易实现的!

6:常用实现类的一些继承关系

       Collections,它是Java.util下的一个类。它为我们提供了许多有用的方法,如sort(...),max()等其具体用法可以参考API文档,比如sort(List list);中list内的所有元素都必须实现
Comparable接口(All elements in the list must implement the Comparable interface)。

       Arrylist ,它是List接口的实现类,而List则是继承于Collection。
       LinkedList,它也是间接对Colections的实现。用linkedlist的一些方法如addfirst(),removefirst(),addlast()等等可以用来实现如C中的堆栈,链表。(对于频繁使用插入与删除操作使用linkedlist是个不错的选择,对于经常进行索引操作则arrylist较好)。 

       HashSet(散列表),它实现了Set接口,也就意味着它的元素不能有重复值出现。并且在HashSet中没有get()方法,但可以通过iterator()来实现。要注意的是假如要在HasSet中存放一些对象,那么你得重定义hashCode()与equals()二个方法来保不可以存放相同的内容的元素。对于hashcode()所返回的值,hashset用它来计算(通过特定的函数)该对象在内存中的存放位置;后者主要用来判断二个对象的内容是否相等而返回对应的boolen型。

      TreeSet,主要用来对元素进行排序操作,假如要往其中添加对象,则对象得实现Comparable接口。(假如不要对元素排序,则一般可选用HashSet)。

      HashMap,主要特点是存放的一个键值对,一些有用的方法是可返回视图(我觉得可以把它理解为一个集合)如:keyset(),values(),entyset()等。


       关于对HashMap的小步深入理解:
       HashMap是由键值对组成的,关于HashMap有二点要注意:1. 它的键只能是一个Object对象。 2. 当二个HashMap用equals方法比较时,实际的比较是它的Key,而与Value无关。

       HashMap的主要特点是其底层的物理存放与查找用到了hash函数相关的原理。根据java窗口的查找原理,查找最快的应该是由数组经过工具类Arrays的Arrays.sort方法排序后,再用此工具类的Arrays.binarySearch方法进行查找。对于HashMap的数据查找就是用这个原理实现的,另外由于数组的致命缺点就是它是定长的,而HashMap却是可以动态增加,所以查找过程其实不是将Key本身放在一个Object[]的数组中,而是将与Key有密切相关的信息做为索引Object[]数组的下标,然后根据此下标去Object[]数组中查找数据,这个所谓密切相关的信息就是通过Key.hashCode()函数所产生的数字。可想而知,当HashMap中的Key很多时,各Key所产生的hashCode肯定会有重合的现象发生,为了防止此情况发生,所以根据这个索引在数组中得到的对象并不是最终要查找的数据,查到的其实是一个list列表,在这列表中列出了由于HashMap中的Key通过散列后具有相同hashCode的全部对像。可以想像得到,这个列表中的对像应该是相当少的。对于对Object[]数据下下标定位后,就得到了这个列表,接下来equals函数粉墨登场了,若能返回true则表示此对象已经存在,这时HashMap会用新的值覆盖旧值,若不存在则会做添加操作了。

       在HashMap的初始化中,会涉及到二个比较重要的值,也是影响其性能的二个重要值:Object[]的长度(v1)、Object[]中实际已经存放了多少object对象(v2)。在我们初始化HashMap时会有:HashMap(int initialCapacity, float loadFactor) 这个方法,initialCapacity表示object[]的初始化长度,loadFactor表示允许此在Object[]存放数据的百分比(loadFactor=v2/v1),系统默认的是0.75(也就是可以存放占object[]数组3/4的数据)。当HashMap里的数据不断增加时,它会自动地按数量级扩展Object[]的长度(应该尽量阻止Object[]的自动增加,这样不但消费资源对于以后的查找、插入操作也不利)。
HashMap结论:对于Key一定要实现hashCode() and equals方法,且尽量要让hashCode散布得均匀。这样才能充分利用Object[]数组,不然,会导致Object[]得不到充分利用,而在Object[index]具体对应的对象list列表中存放很多Key对像,而在list中进行查找操作是比较耗时的。

       根据以上原理,HashMap的简单实现:

import java.util.*;
import com.bruceeckel.util.*;

public class SimpleHashMap extends AbstractMap {
  // Choose a prime number for the hash table

  // size, to achieve a uniform distribution:

  private static final int SZ = 997;
  private LinkedList[] bucket = new LinkedList[SZ];
  public Object put(Object key, Object value) {
    Object result = null;
    int index = key.hashCode() % SZ;
    if(index < 0) index = -index;
    if(bucket[index] == null)
      bucket[index] = new LinkedList();
    LinkedList pairs = bucket[index];
    MPair pair = new MPair(key, value);
    ListIterator it = pairs.listIterator();
    boolean found = false;
    while(it.hasNext()) {
      Object iPair = it.next();
      if(iPair.equals(pair)) {
        result = ((MPair)iPair).getValue();
        it.set(pair); // Replace old with new

        found = true;
        break;
      }
    }
    if(!found)
      bucket[index].add(pair);
    return result;
  }
  public Object get(Object key) {
    int index = key.hashCode() % SZ;
    if(index < 0) index = -index;
    if(bucket[index] == null) return null;
    LinkedList pairs = bucket[index];
    MPair match = new MPair(key, null);
    ListIterator it = pairs.listIterator();
    while(it.hasNext()) {
      Object iPair = it.next();
      if(iPair.equals(match))
        return ((MPair)iPair).getValue();
    }
    return null;
  }
  public Set entrySet() {
    Set entries = new HashSet();
    for(int i = 0; i < bucket.length; i++) {
      if(bucket[i] == null) continue;
      Iterator it = bucket[i].iterator();
      while(it.hasNext())
        entries.add(it.next());
    }
    return entries;
  }
  public static void main(String[] args) {
    SimpleHashMap m = new SimpleHashMap();
    Collections2.fill(m, Collections2.geography, 25);
    System.out.println(m);
  }
}


TreeMap,它与HashMap差不多,不过是增加了对元素的排序功能,所以运行速度也就当然没有hashmap来得快了。
    以下是HashMap的一个实例(在对DB进行操作的时候很有用):

HashMap valueMap;
//this function just get key-value form DB ,defined by yourself

valueMap = commondb.getElementStringValues("COMMENT_ID", "content");
java.util.Set tempkeys = valueMap.entrySet();
            java.util.Iterator keys = tempkeys.iterator();
while(keys.hasNext())
                {
                    java.util.Map.Entry me=(java.util.Map.Entry)keys.next();
String value = me.getValue();
int key = me.getKey();
}


要注意的是entrySet()所返回的每一个元素都是Map.Entry类型的!(Returns a collection view of the mappings contained in this map. Each element in the returned collection is a Map.Entry.)      
 
       Properties,继承于hashtable。这个东东相信我们比较的喜欢了(在i18n,ant中可以是常见得很),呵呵。它可以从外部导入属性文件。文件中的键值都是String类型。just like this:

company=study
author
=
Jkallen
copyright
=2005-2006

操作如下:

import java.util.*;
import java.io.*;
class PropTest
{
    public static void main(String[] args)
    {
        /*Properties pps=System.getProperties();
        pps.list(System.out);*/

        Properties pps=new Properties();
        try
        {
            pps.load(new FileInputStream("winsun.ini"));
            Enumeration enum=pps.propertyNames();
            while(enum.hasMoreElements())
            {
                String strKey=(String)enum.nextElement();
                String strValue=pps.getProperty(strKey);
                
                System.out.println(strKey+"="+strValue);
            }
        }
        catch(Exception e)
        {
            e.printStackTrace();
        }
    }
}


其用法可以查看API文档呢。

        Java中的集合容器确实不少呢...其中有些我们也许一直都用不到,(我也是查看了些相关的资料再加上自己的一些想法整理了一下,希望对相关朋友有用!)可是重要的是知道我们在实现一个功能时应该选用哪种集合类来实现就OK了。
阅读(701) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~