[技术讨论] [Perl]超大哈希表（超过1G的那种）的存取

本帖最后由 523066680 于 2018-9-22 12:01 编辑

在CU遇到几次超大哈希的处理问题。这边也分享一下。
通过使用 DB_File 模块，可以将哈希数据存取操作转为在磁盘文件中处理，避免爆内存。

写入示例：

use DB_File;
STDOUT->autoflush(1);

my $DBFile = "F:/temp.db";
unlink $DBFile if ( -e $DBFile );

my %h;
tie %h, "DB_File", $DBFile, O_WRONLY|O_CREAT, 0666, $DB_BTREE or die "$!" ;

# Make many useless hash key/value
my $max = 1000_0000;
my ($iter, $curr, $prev) = (0, 0, 0);

while ($iter++ < $max)
{
    $h{ $iter } = join("", map { ('a'..'z')[rand(26)] } (0 .. int(rand(60)+1) ) );

    $curr = $iter / $max * 100.0;
    if ( ($curr - $prev) >= 1.0)
    {
        printf "%.1f\% ", $curr;
        $prev = $curr;
    }
}

untie %h;
print "Done\n";
复制代码

由于时间长，加了一些进度显示的代码。
实际过程非常简单，创建数据库文件 -> tie 绑定数据库和哈希表名称 -> 像常规操作哈希表一样存取 -> untie %h 结束操作并保留结果。

读取示例：

use DB_File;
my $DBFile = "F:/temp.db";
my %h;
tie %h, "DB_File", $DBFile, O_RDONLY, 0666, $DB_BTREE or die "$!" ;
print $h{"100021"};
untie %h ;
复制代码

FuniCode 编程论坛

Wiki

列兵

Rank: 1

帖子: 10
积分: 33
技术: 2
捐助: 0
注册时间: 2018-9-23

2楼

发表于 2018-9-23 00:08 | 只看该作者

避免爆内存。

New BEE

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[技术讨论] [Perl]超大哈希表（超过1G的那种）的存取

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]