软件开发过程中,不可避免会用到集合,c#中的集合表现为数组和若干集合类。不管是数组还是集合类,它们都有各自的优缺点。如何使用好集合是我们在开发过程中必须掌握的技巧。不要小看这些技巧,一旦在开发中使用了错误的集合或针对集合的方法,应用程序将会背离你的预想而运行。
建议20:使用泛型集合代替非泛型集合
在建议1中我们知道,如果要让代码高效运行,应该尽量避免装箱和拆箱,以及尽量减少转型。很遗憾,在微软提供给我们的第一代集合类型中没有做到这一点,下面我们看arraylist这个类的使用情况:
arraylist al=new arraylist();
al.add(0);
al.add(1);
al.add("mike");
foreach (var item in al)
{
console.writeline(item);
}
上面这段代码充分演示了我们可以将程序写得多么糟糕。
首先,arraylist的add方法接受一个object参数,所以al.add(1)首先会完成一次装箱;其次,在foreach循环中,待遍历到它时,又将完成一次拆箱。
在这段代码中,整形和字符串作为值类型和引用类型,都会先被隐式地强制转型为object,然后在foreach循环中又被转型回来。
同时,这段代码也是非类型安全的:我们然arraylist同时存储了整型和字符串,但是缺少编译时的类型检查。虽然有时候需要有意这样去实现,但是更多的时候,应该尽量避免。缺少类型检查,在运行时会带来隐含的bug。集合类arraylist如果进行如下所示的运算,就会抛出一个ivalidcastexception:
arraylist al=new arraylist();
al.add(0);
al.add(1);
al.add("mike");
int t = 0;
foreach (int item in al)
{
t += item;
}
arraylist同时还提供了一个带icollection参数的构造方法,可以直接接收数组,如下所示:
var intarr = new int[] {0, 1, 2, 3};
arraylist al=new arraylist(intarr);
该方法内部实现一样糟糕,如下所示(构造方法内部最终调用了下面的insertrange方法):
public virtual void insertrange(int index, icollection c)
{
if (c == null)
{
throw new argumentnullexception("c", environment.getresourcestring("argumentnull_collection"));
}
if ((index < 0) || (index > this._size))
{
throw new argumentoutofrangeexception("index", environment.getresourcestring("argumentoutofrange_index"));
}
int count = c.count;
if (count > 0)
{
this.ensurecapacity(this._size + count);
if (index < this._size)
{
array.copy(this._items, index, this._items, index + count, this._size - index);
}
object[] array = new object[count];
c.copyto(array, 0);
array.copyto(this._items, index);
this._size += count;
this._version++;
}
}
概括来讲,如果对大型集合进行循环访问、转型或装箱和拆箱操作,使用arraylist这样的传统集合对效率影响会非常大。鉴于此,微软提供了对泛型的支持。泛型使用一对<>括号将实际类型括起来,然后编译器和运行时会完成剩余的工作。微软也不建议大家使用arraylist这样的类型了,转而建议使用它们的泛型实现,如list<t>。
注意,非泛型集合在system.collections命名空间下,对应的泛型集合则在system.collections.generic命名空间下。
建议一开始的那段代码的泛型实现为:
list<int> intlist = new list<int>();
intlist.add(1);
intlist.add(2);
//intlist.add("mike");
foreach (var item in intlist)
{
console.writeline(item);
}
代码中被注释的那一行不会被编译通过,因为“mike”不是整型,这里就体现了类型安全的特点。
下面比较了非泛型集合和泛型集合在运行中的效率:
static void main(string[] args)
{
console.writeline("开始测试arraylist:");
testbegin();
testarraylist();
testend();
console.writeline("开始测试list<t>:");
testbegin();
testgenericlist();
testend();
}
static int collectioncount = 0;
static stopwatch watch = null;
static int testcount = 10000000;
static void testbegin()
{
gc.collect(); //强制对所有代码进行即时垃圾回收
gc.waitforpendingfinalizers(); //挂起线程,执行终结器队列中的终结器(即析构方法)
gc.collect(); //再次对所有代码进行垃圾回收,主要包括从终结器队列中出来的对象
collectioncount = gc.collectioncount(0); //返回在0代码中执行的垃圾回收次数
watch = new stopwatch();
watch.start();
}
static void testend()
{
watch.stop();
console.writeline("耗时:" + watch.elapsedmilliseconds.tostring());
console.writeline("垃圾回收次数:" + (gc.collectioncount(0) - collectioncount));
}
static void testarraylist()
{
arraylist al = new arraylist();
int temp = 0;
for (int i = 0; i < testcount; i++)
{
al.add(i);
temp = (int)al[i];
}
al = null;
}
static void testgenericlist()
{
list<int> listt = new list<int>();
int temp = 0;
for (int i = 0; i < testcount; i++)
{
listt.add(i);
temp = listt[i];
}
listt = null;
}
输出为:
开始测试arraylist:
耗时:2375
垃圾回收次数:26
开始测试list<t>:
耗时:220
垃圾回收次数:5
以上介绍了编写高质量代码改善c#程序——使用泛型集合代替非泛型集合(建议20),有关编写高质量代码建议1到建议157,本完整会持续更新,敬请关注,谢谢。