而对业绩状况做分析可以帮助决策层更了解自
己和对手。企业的管理者需要从系统中发掘更
多数据资产,基于此来进行更好地进行市场的
战略部署。
本文结合微软的 .NET 技术,对现有的房
源信息、销售数据和市场成交数据依据规则进
行匹配,帮助案例企业实时地了解企业的业绩
状况,提高业务决策的有效性和可靠性。
1 案例企业已有数据系统的现状
案例企业成立于 1998 年,在其他中介公
司还是基于 Excel 或者使用纸笔来记录房源信
息和客户带看信息的时候。该公司已定制部署
了一套 C/S 架构的集中式房源管理信息系统。
在互联网大潮下,企业已无法依赖单一信
息系统来与新进者竞争。管理层迫切地希望可
以通过新的IT技术手段,把房源等内部信息,
与外部数据结合起来做分析,形成一个数据平
台,消除数据孤岛。
2 数据匹配
数据匹配是数据之间按照某种内在关系
进行配准。
确定性数据匹配方法中,当参与匹配的
列都满足匹配规则(相等规约)时,这对记录
被认为是同一个实体。目前比较通用的做法是
计算每对记录的匹配权重,与用户手动设定的
界限值比较,根据比较结果,将该对记录分类
为匹配,不匹配或可能匹配。
3 C#
通过 C# 实现房屋中介行业数据的模糊匹配
文/宋家麟
房屋中介行业的经营者常会
从不同的数据源中提取相关的成
交数据、业绩数据,对数据进行
清理以保证数据的正确性。随后
将数据进行不同维度的匹配,从
而将数据变为信息和知识,以辅
助企业做出正确的决策。本文尝
试通过 C# 语言结合正则表达式来
解释数据进行匹配如何在行业中
应用。
摘
要
C#是微软推出的一种基于.NET框架的、
面向对象的高级编程语言。C ♯由 C 语言和
C++ 派生而来,继承了其强大的性能,同时又
以 .NET 框架类库作为基础,拥有类似 Visual
Basic 的快速开发能力。
C# 并不被编译成为能够直接在计算机
上执行的二进制本地代码。与 Java 类似,它
被编译成为中间代码(Microsoft Intermediate
Language),然后通过 .NET Framework 的虚
拟机——被称之为通用语言运行库——执行。
4 正则表达式
正则表达式,又称正规表示式、常规表
示法(英语:Regular Expression,在代码中常
简写为 regex),是计算机科学的一个概念。
正则表达式使用单个字符串来描述、匹配一系
列匹配某个句法规则的字符串。在很多文本编
辑器里,正则表达式通常被用来检索、替换那
些匹配某个模式的文本。
许多程序设计语言都支持利用正则表达
式进行字符串操作。例如,在 C# 中就内建了
一个功能强大的正则表达式引擎(Regex)。
5 C#结合正则表达式进行模糊数据匹配
的实例
5.1 数据查询优化模块设计
由于全市的楼盘信息众多,同时每月的
成交数据量也非常大,当需要进行多维度数据
查询时,会遇到系统性能瓶颈。故预先将不同
数据源的数据依据一定业务规则进行匹配,并
预处理和分类。
5.2 数据查询优化有关的主要程序代码
5.2.1 将外部数据与内部数据进行整合、匹配
C# 代码中使用正则表达式,通过物业地
址的近似度,将临时表中的成交数据与盘源系
统中的盘源数据进行匹配。下面以 *** 路 ***
弄 *** 支弄为例。
(1)在代码中定义正则表达式。
static string fullAddressFormat1 = @"(.+)
路 (\d+) 弄 (\d+) 支弄 ";
s t a t i c R e g e x a d d R e g 1 = n e w
Regex(fullAddressFormat1);
(2)依据正则表达式对内存中的数据进
行判断。
if(addReg1.IsMatch(centaPropAddress))
{
……
}
(3)依据维度信息计算数据的排列、组
合与计算
EnumerableRowCollection<DataRow>
queryDtAgencyTotal =
from agencyAmount in dtAgency.
AsEnumerable()
where agencyAmount.
Field<String>("EstateName2").Trim().
Equals(row["EstateName2"].ToString().Trim())
select agencyAmount;
(4)合并 HTML 代码至结果集的主要代
码如下:
s b T a b l e . A p p e n d ( " < t d
class=Row1Col2>");
sbTable.Append(dtRegionTotalAmount.
Rows[i]["amount"].ToString().Trim());
sbTable.Append("</td>");
(5)序列化数据并入库
嵌有 HTML 代码的数据流无法直接存入
数据库中,故采用了 .NET 框架中所提供的序
列化函数来对数据内容进行处理。
sbArea.Append(CentaBI.ReportLogic.
Common.SerializeDataTableXml(dtAreaResult));
6 总结
为了适应行业变化,本文设计并实现了
一种通过 C# 与正则表达式相结合为核心的数
据匹配模块。通过掌握更多的行业数据、企业
经营业绩数据,成功地为企业的管理和决策提
供有力依据。
参考文献
[1] 熊建芳,高继,任贺宇,基于 ASP.NET 的
ADO 与 ADO.NET 分析与研究 [J]. 计算机与
现代化 ,2006(07),36-38.
[2] 谭学清 , 谭永丽 , 陆泉 , 陈静 . 商务智能
[M]. 武汉 : 武汉大学出版社 ,2006(10).
[ 3 ] A l i s t a i r M c L e o d , B u s i n e s s
Intelligence:Discover the truth
about your business,Waterstons white
paper,2005,3-5.
作者单位
上海大学计算机工程与科学学院 上海市
200444
本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除! 快速论文发表网(www.ksfbw.com)本中心和国内数百家期刊杂志社有良好的合作关系,可以帮客户代发论文投稿.
投稿邮箱:ksfbw@126.com
客服Q Q:
82702382
联系电话:15295038833
本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除!
下一篇:探讨大数据时代电力信息技术
文章评论
共有 0 位网友发表了评论