关于《关于对搜于特集团股份有限公司2019年年报的问询函》的回复意见
亚太(集团)会计师事务所(特殊普通合伙)
关于《关于对搜于特集团股份有限公司2019年
年报的问询函》的回复意见
深圳证券交易所中小板公司管理部:
由搜于特集团股份有限公司(以下简称“搜于特公司”或“公司”)转来的《关于对搜于特集团股份有限公司2019年年报的问询函》(中小板年报问询函【2020】第355号)(以下简称“问询函”)收悉。我们已对问询函中需要我们说明的财务事项进行了审慎核查,现将核查情况汇报如下:
一、年报显示,你公司长期借款余额8.80亿元,较期初增长877.78%,货币资金余额为13.06亿元。请结合你公司货币资金可使用状态说明你公司存贷双高的合理性,在货币资金相对充裕的情况下长期借款大幅增加的原因,请说明相关借款用途,并结合你公司银行授信情况、货币资金、现金流及收支安排、债务到期情况,说明你公司长期借款大幅增加的合理性,是否存在短期偿债风险。请会计师说明对公司货币资金所执行的审计程序及获取的审计证据。
公司回复:
(一)公司存贷双高的合理性,在货币资金相对充裕的情况下长期借款大幅增加的原因。
1、货币资金余额较高的合理性
货币资金余额情况如下:
金额:万元
截至2019年12月31日,公司货币资金余额130,641.21万元,其中:1)保证金71,644.98万元主要用于开具银行承兑汇票和支付保函,在其对应的票据或保付款项到期偿付前,不得自由使用;2)2016年非公开发行股票募集资金专户余额6.14万元,专项用于仓储物流基地建设项目等募投项目使用;3)扣除以上项目后,公司可自由支配的货币资金余额为58,694.89万元。
近三年公司可自由支配货币资金情况如下:
金额:万元
2019年末公司货币资金余额相比以往年度增长较大,但同期可自由支配货币资金余额相比以往年度有所下降。主要是由于宏观经济环境的影响,银行不同程度提高了应付票据保证金比率。受此影响,货币资金中票据保证金比例增高,该保证金全部用于公司及控股子公司开展经营业务,公司及控股子公司没有对控股股东、实际控制人、关联方及其他任何外部单位提供担保。
2019公司使用受限资金情况如下:
金额:万元
2、长期借款增加的原因
长期借款增加的原因如下:
(1)长期借款用于弥补公司资金需求,提高借款资金使用效率,优化债务结构
①公司日常经营的需要
公司的长期借款款项用于日常生产经营的原料采购等,弥补可自由支配的资金,满足公司日常经营的资金需求。
②偿还短期债务的需要
公司短期待偿还债务较多。为保障按期履行还款义务,公司通常会储备一定规模的货币资金用于短期债务的偿还。
③提高借款资金使用效率,优化债务结构
长期借款相对于短期借款,借款周期更长。短期借款到期归还再续贷,公司资金归集较为频繁,缩短了公司对资金的实际使用时间。长期借款的资金实际使用天数更长,提高借款资金使用效率;同时,也减轻公司短期偿债压力,优化了债务结构。
(2)增加抗风险能力、实现公司发展战略的需要
考虑到中美贸易摩擦、宏观经济环境、国际贸易环境和国内经济周期性矛盾等诸多内外不确定因素的影响,公司业务经营规模较大,需要储备足额营运资金以保障经营发展,确保公司在外部环境发生变化时能有一定的风险承受能力。
此外,公司进军医疗用品业务领域。新业务要储备一定的资金余量,避免因资金问题,从而影响公司的战略规划实施。
综上,公司在货币资金相对充裕的情况下长期借款大幅增加是合理的。
(二)说明相关借款用途,并结合你公司银行授信情况、货币资金、现金流及收支安排、债务到期情况,说明你公司长期借款大幅增加的合理性,是否存在短期偿债风险。
1、长期借款用途
2019年末长期借款用于采购棉纱、纤维、布料等原材料。
2、授信情况
公司与众多银行建立了良好合作关系,具备良好的融资能力。2019年度公司获得银行授信额度58.97亿元;其中,获得授信合同中长期资金借款额度10
亿元。考虑到长期借款资金使用周期和资金使用效率的优势,公司已优先使用长期资金借款额度10亿元。截至2020年6月30日,公司尚在有效期内的银行授信额度65.88亿元,尚余19.98亿元授信额度未使用。
公司具有良好征信,一直严格遵守银行结算制度,未出现逾期还款情况。良好的银企关系为公司短期债务清偿提供了合理保障。
3、货币资金情况
2017年至2019年,公司各期末短期借款及一年内到期的非流动负债余额合计分别为148,082.54万元、191,856.33万元和154,153.73万元。公司可自由支配货币资金余额与短期债务余额之间呈现较为平稳的配比关系。具体如下:
单位:万元
4、债务到期及资金安排情况
公司2020年内到期应偿还的短期借款及一年内到期的非流动负债金额合计15.42亿元;其中,2020年1-6月内到期应偿还的借款金额合计10.14亿元。前述到期的借款均已按期归还本息,无展期或逾期情况。具体如下:
单位:万元
2020年第三季度和第四季度分别有9,213.53万元、43,590万元短期借款及一年内到期的非流动资产将要到期。主要还款来源:
(1)公司可自由支配货币资金;
(2)公司销售商品提供劳务收到的现金:公司2019年月均销售商品提供劳
务收到的现金126,700万元;2020年受疫情影响,上半年月均销售商品提供劳
务收到的现金预计70,152万元。
截至2020年6月30日,公司尚在有效期内的银行授信额度65.88亿元,尚余19.98亿元授信额度未使用。公司将有足够的信用额度用于购买商品、接受劳务的资金支付需求。
公司将根据2020年度资金安排,严格执行授权审批等资金内部管理制度,加强应收账款管理,严格费用管控,合理有序地安排营运资金支出。根据债务到期情况与应收账款回收情况,合理安排债务偿还规划,有效的保障公司的正常生产经营与债务及利息的偿还。
同时,公司将结合市场状况和运营需求,必要时选择合适有效的金融工具,合理调配自有资金与金融机构授信,支撑公司正常发展。
综上,公司具有良好的偿债能力,短期偿债风险较小。但如果金融市场产生波动,进而影响银行对公司授信规模收缩、限制或取消,则可能会对公司的偿债能力产生一定的负面影响。
会计师回复:
针对公司货币资金,我们主要实施了以下审计程序并获得了相应的审计证据,包括但不限于:
1、了解与货币资金业务相关的内部控制,并测试相关内部控制的有效性;
2、对库存现金监盘,并与现金日记账进行核对;
3、获取公司2019年12月31日银行存款的对账单原件,并与期末账面金额进行核对,根据企业信用报告核对贷款信息是否与账面保持一致;
4、获取银行对账单及余额调节表,对银行账户存款、借款、应付票据等内容实施函证,并由审计人员对函证过程进行控制;
5、获取重要公司的主要银行账户的全年银行流水记录,并对大额银行交易进行抽查。抽查内容主要包括业务摘要、金额等是否与账面记录一致等;
6、对公司主要银行存款进行截止性测试,包括检查公司账务记录与银行对账单记录、金额是否一致,以确认是否存在跨期的情况。
我们认为,我们已实施了必要的审计程序,获取了充分、适当的审计证据。2019年末货币资金内的保证金全部用于公司及控股子公司开展经营业务。我们未发现公司及控股子公司对控股股东、实际控制人、关联方及其他任何外部单位提供担保的情况。
二、年报显示,你公司报告期末应收账款金额为25.75亿元,占总资产比例22.76%,较期初增长31.64%。请你公司结合信用政策、结算方式等分析应收账款大幅增长的合理性,并结合同行业可比公司会计政策、近两年应收账款的实际回收周期、期后回款情况等分析说明对应收账款的坏账准备计提是否合理、谨慎,并请年审会计师发表明确意见。
公司回复:
(一)结合公司信用政策、结算方式等分析应收账款大幅增长的合理性。
1、2018、2019年末应收账款变动情况
单位:万元
2、公司主要业务信用政策及结算方式变化情况分析
公司主要根据客户的信用、资质、资产等给予一定的信用额度与信用期。品牌服装业务根据加盟商加盟时间的长短、每期的进货金额、回款的及时性以及加
盟商本身的实力区分不同的信用等级,对不同等级的加盟店给予不同的信用期与信用额度。由于近年来国内服装消费市场放缓,服装业务持续下行压力大,为缓解加盟商资金压力发展服装业务,公司2016年初根据实际情况调整了服装业务信用政策,新加盟的客户根据资质给予3-6个月的信用期,合作期限一年以上的老客户给予3-9个月的信用期,合作期限一年以上老客户开新店、扩展店铺、更新改造老店铺的可以延长给予12个月的信用期。供应链管理业务一般为现款现货或预收款项,但也会根据客户合作时间、客户资质、客户信用情况一般给予1-3个月的信用期。2019年度将供应链管理业务部分客户由现款现货或预收部分款项,调整为根据客户信用评级情况给予30-90天的信用期。时尚电子类业务根据客户信用评级情况给予信用期30-90天。保理类业务根据客户信用评级情况一般给予60-360天的信用期。综上,除供应链管理部分客户信用期有所变化外,公司其他信用政策未发生明显变化。
3、各类业务应收账款及收入变化情况分析
单位:万元
公司报告期末应收账款较上年末大幅增长,主要系材料类业务、服装类业务期末余额增长所致。
(1)材料类业务应收账款期末余额较上年末增长5.70亿元,主要是公司供应链管理业务将部分客户由现款现货或预收部分货款调整为根据信用评级情况给予30-90天的信用期所致;
(2)服装类业务应收账款期末余额较上年末增加约0.99亿元,主要系2019年下半年纺织服装行业整体回暖,公司下半年销售比上半年增加1.84亿元,客户欠款增加所致。
(二)结合同行业可比公司会计政策、近两年应收账款的实际回收周期、期后回款情况等分析说明对应收账款的坏账准备计提的合理性、谨慎性。
1、公司会计政策
公司从2019年1月1日开始执行新的金融工具准则,对于应收款项,本公司按照整个存续期的预期信用损失计量损失准备。
(1)单项金额重大并单项计提坏账准备的应收款项坏账准备的确认标准、计提方法
公司将金额为人民币 100 万元(含)以上且占应收账款账面余额10%以上的应收账款确认为单项金额重大的应收账款;将期末余额大于 10万元(含)以上且占其他应收款账面余额10%以上的其他应收款分类为单项金额重大的其他应收款。本公司对单项金额重大的应收款项单独进行减值测试,单独测试未发生减值的金融资产,包括在具有类似信用风险特征的金融资产组合中进行减值测试。单项测试已确认减值损失的应收款项,不再包括在具有类似信用风险特征的应收款项组合中进行减值测试。
(2)单项金额虽不重大但单项计提坏账准备的应收款项
对于单项金额虽不重大但具备以下特征的应收款项,如:与对方存在争议或涉及诉讼、仲裁的应收款项;已无法与债务人取得联系并且无第三方追偿人;有明显迹象表明债务人很可能无法履行还款义务的应收款项等,单独进行减值测试,有客观证据表明其发生了减值的,根据其未来现金流量现值低于其账面价值的差额,确认减值损失,计提减值准备。
(3)按信用风险组合计提坏账准备的应收款项的确定依据、坏账准备计提方法
①信用风险特征组合的确定依据
本公司对单项金额不重大以及金额重大但单项测试未发生减值的应收款项,按信用风险特征的相似性和相关性对金融资产进行分组。这些信用风险通常反映债务人按照该等资产的合同条款偿还所有到期金额的能力,并且与被检查资产的
未来现金流量测算相关。
不同组合的确定依据:
②各组合的账龄与整个存续期信用损失率对照表
③按金融业风险程度与整个存续期预期信用损失率对照表
2、公司2019年末应收账款坏账准备的计提情况
(1)类别明细情况
单位:元
(续上表)
其明细计提坏账准备如下:
单位:元
按单项计提坏账准备为19,520,992.86元。
单位:元
按组合计提坏账准备:193,634,035.91元
确定该组合的依据是按合并范围内各公司销售主体行业类型。
(2)组合中,采用账龄分析法计提坏账准备的应收账款
(3)组合中,采用金融业风险程度分类法计提坏账准备的应收保理贷款
3、同行业可比公司会计政策分析
(1)与同行业可比公司会计政策之账龄分析法比较
(2)与同行业坏账准备计提比例对比表如下:
单位:万元
注:数据来源于各公司披露的2019年年报,相关详细数据以各公司披露的年报为准。
上表中,同行业四家上市公司平均应收账款坏账准备计提比例约为9.53%,而公司应收账款坏账准备计提比例约为7.65%,略低于行业平均水平。主要是因为美邦服饰2019年对应收账款进行了会计估计变更,2018年使用个别认定法计提应收账款坏账准备变更为根据不同客户的信用风险特征,以账龄组合为基础评估应收账款的预期信用损失,坏账准备计提比例由2018年的6.88%上升到17.84%,如果不考虑美邦服饰的影响,本公司的应收账款坏账准备计提比例略高于上述三家同行业上市公司平均应收账款坏账准备计提比例6.51%。
4、近两年应收账款的实际回收周期、期后回款情况
(1)公司采用账龄分析法计提坏账准备的应收账款的实际回收周期及期后回款情况如下表所示:
单位:万元
注:2019年末应收账款余额下一年度回款金额截止2020年6月30日。
(2)公司采用金融业风险程度分类法计提坏账准备的应收保理款的实际回收周期及期后回款情况如下表所示:
单位:万元
注:2019年末应收账款余额下一年度回款金额截止2020年6月30日。
如上表所示,采用账龄分析法计提坏账准备的应收账款中,公司在2018年、2019年度收回上一年度末应收账款余额的回款率分别为76.46%和67.24%,公司在2020年1-6月收回2019年末应收账款余额的回款率为33.26%;采用金融业风险程度分类法计提坏账准备的应收保理款中,公司在2018年、2019年度收回上一年度末应收账款余额的回款率均为100.00%,公司在2020年1-6月收回2019年末应收保理款余额的回款比例为0.33%,未收回的均是尚末到期应收保理款。
2018年度公司应收账款周转天数为37.45天,2019年度公司应收账款周转天数为68.05天,应收账款周转率有所下降。2020年上半年度受新冠疫情影响,品牌服饰店铺客流减少,使得店铺资金回笼慢;公司供应链管理业务上下游客户受疫情影响复工复产延迟导致营业收入下降也出现资金回笼慢,公司回款比例下降,公司正积极采取相应措施加强应收账款回收进度。公司已关注到应收账款周转率下降的情况,严格审核客户信用条件,并在2020年报中继续增加单项计提坏账准备金额。
综上,公司结合信用政策、结算方式等分析,应收账款大幅增长具有合理性,结合同行业可比公司会计政策、近两年应收账款的实际回收周期、期后回款情况等分析,公司应收账款坏账准备计提具备合理性、谨慎性。
会计师回复:
(一)针对公司的应收账款,我们主要实施了以下审计程序,包括但不限于:
1、访谈公司管理层,了解公司应收账款信用政策;
2、对公司信用政策及应收账款管理的相关内部控制的设计和运行有效性进
行测试;
3、分析应收账款增长与营业收入的增长是否匹配,关注信用政策、结算方式执行情况,并与同行业情况进行比较;
4、根据抽样原则,检查与应收款项余额相关的销售合同、销售发票、出库单、发货单签收记录,评价应收账款的确认是否符合会计政策;
5、按照抽样原则选择客户样本,询证报告期内重要客户的应收账款余额及销售额。
我们认为,针对公司应收账款,我们已实施了必要的审计程序,公司应收账款增长具备合理性。
(二)针对公司的应收账款的坏账准备,我们主要实施了以下审计程序,包括但不限于:
1、获取管理层编制的应收账款账龄分析表,选取样本检查了应收账款账龄分析表的准确性;
2、获取公司坏账准备计提表,检查计提方法是否按照一贯的政策执行,并重新计算坏账计提金额是否准确;
3、通过分析应收账款的账龄和客户信誉情况,对于个人客户获取身份证信息对其是否失信进行核查,并执行应收账款函证程序,评价应收账款坏账准备计提的合理性;
4、对账龄较长的企业客户进行网络查询,关注是否存在失信或经营异常情况;
5、关注单项金额重大或对于单项金额虽不重大但具备明显特征的应收款项,对单项测试并计提坏账准备的应收账款进行复核。
我们认为,针对公司应收账款坏账准备,我们已实施了必要的审计程序,公司应收账款的坏账准备计提具备合理性、谨慎性。
三、年报显示,你公司存货账面余额为33.86亿元,较期初余额增加16.25%;报告期内计提存货跌价准备1.95亿元,较去年同期增长91.18%。请你公司结合存货构成、产销情况,分析存货增加的原因,计提存货跌价准备的依据及充分性,请对比同行业公司说明公司存货跌价准备计提比例是否处于合理水平,并请年审会计师发表明确意见。
公司回复:
(一)请结合存货构成、产销情况,分析存货增加的原因。
1、从存货构成来看,具体明细如下:
单位:万元
存货较期初余额增加16.07%,主要系库存商品、发出商品增加所致,其中:库存商品增加7.03亿元,发出商品增加1.25亿元。发出商品的增加主要是因为
时尚电子产品已发出到客户店铺尚未满足收入确认条件所致;库存商品增加7.03亿元,委托加工物资减少1.13亿元,两者结合起来合计增加5.9亿元,由于2020年春节较往年提前,2020年春季服装在年前提前入库,导致库存商品增加;其次,2019年联营店比2018年增加127家,联营店库存全部属于公司,联营店增加导致库存商品增加2亿元。
2、存货产销情况
服装库存量比上年同期增长15.56%,主要系公司本期销售量相比去年减少8.67%,2020年春节较往年提前,2020年春季服装需要在年前提前入库,导致库存商品增加;且本期联营店增加127家,从而导致本期服装库存量增加。
材料库存量比上年同期减少13.45%,主要是因为宏观经济环境更趋严峻复杂,经济下行压力加大,为此公司继续放缓供应链管理业务发展速度,也适当降低了供应链管理业务材料备货量。
(二)计提存货跌价准备的依据及充分性,请对比同行业公司说明公司存货跌价准备计提比例是否处于合理水平。
1、计提存货跌价准备的依据
资产负债表日,存货采用成本与可变现净值孰低计量,按照单个存货成本高于可变现净值的差额计提存货跌价准备。直接用于出售的存货,在正常生产经营过程中以该存货的估计售价减去估计的销售费用和相关税费后的金额确定其可变现净值;需要经过加工的存货,在正常生产经营过程中以所生产的产成品的估计售价减去至完工时估计将要发生的成本、估计的销售费用和相关税费后的金额确定其可变现净值。估计售价其中服装部分系根据经销商提货折扣率或当年度的平均销售折扣率乘以吊牌价得出;原材料部分系根据未来订单价格或当年度平均
销售价格。
2、计提存货跌价准备的充分性
对于库存商品部分,公司按单个存货成本高于可变现净值的差额计提存货跌价准备,并结合单个存货产品的周转率情况,针对各款式特点与产品类型以及当前的销售市场,对其销售价格进行核定,并参照资产负债表日后销售情况进行辅证存货跌价准备充分性。
原材料分为对外直接销售原材料和用于生产产品的原材料。对于直接销售原材料部分,公司按未来订单价格或当年度平均销售价格作为估计售价,销售费用率采用销售费用占营业收入的比例进行计算,由于单个原材料周转率较快,且不易产生呆滞料。通过资产负债表日后的实际销售售价进行辅证存货跌价准备充分性。
对于生产产品的原材料部分,公司以所生产的产成品的估计售价减去至完工时估计将要发生的成本、估计的销售费用和相关税费后的金额确定其可变现净值。通过结合单个存货产品的周转率情况,针对各款式特点与产品类型以及当前的销售市场,对其销售价格进行核定,并参照资产负债表日后销售情况进行辅证存货跌价准备充分性。
3、对比同行业公司
与同行业公司存货跌价准备计提比例对比表如下:
单位:万元
从同行业公司数据对比来看,公司存货跌价准备计提比例偏低,主要原因:(1)业务模式不同。2019年公司存货中原材料11.25亿元,其中供应链管
理业务原材料8.81亿元,服装业务原材料2.44亿元,供应链管理业务原材料直接用于对外销售,原材料周转率高,该部分原材料跌价风险较低,扣除供应链业
务影响后,存货跌价计提比例为7.76%,略低于同行业水平。
(2)服装销售渠道不同。公司主要为加盟店与联营店相结合模式, 同行业森马服饰主要以加盟店为主的模式。联营店模式下存货属于公司,加盟店模式下存货属于加盟店,模式的不同会导致同收入规模下,联营店存货备货量大于加盟店备货,从而公司同收入规模下存货余额大于同行业水平。
(3)产品市场定位不同。公司产品以打造高性价比的潮流服饰,主要定位
于国内三、四线市场。九牧王产品定位中高端,森马服饰、美邦服饰布局国内一、二、三、四线城市,由于市场定位不同,公司库存商品的平均单位成本低于同行业,同时单位租金成本低于同行业水平。
(4)产品销售费用率不同。公司产品、渠道、市场定位的特点会导致销售
费用率低于同行业。公司主要产品为服装与材料,其中材料销售收入占比84.05%,而同行业主要产品为服装;公司销售渠道以联营为主,联营方式管理较为简单,而同行业其他公司采用自营与加盟为主,自营渠道人工成本、租赁成本、广告成
本均比联营渠道高;公司销售主要定位于三、四线城市,从而导致公司的租赁费
用相比同行业偏低。
综上所述,由于公司供应链业务模式、产品销售渠道、产品定位、推广力度等特点影响,导致同等营业规模下存货余额(包含供应链业务的存货备货)较同
行业偏大,但产品单位成本、销售费用率相比同行业偏低。公司目前存货跌价准
备计提政策与公司业务模式、产品渠道及市场定位相适应,具有合理性。
会计师回复:
针对公司的存货跌价准备,我们主要实施了以下审计程序,包括但不限于:
1、了解与存货相关的关键内部控制,评价其设计是否有效,并测试相关内
部控制的运行有效性;
2、对存货实施抽样监盘程序,检查存货的数量、观察存货状况等,并重点
对长库龄存货进行了抽查;
3、针对分布在全国各地的联营商存货,采用审计抽样方法抽取部分联营门店样本对其期末存货数量进行发函确认,抽取部分联营门店进行实地查看其营业情况;对直营店期末存货采用审计抽样方法抽取部分店铺进行盘点;并通过检查道讯系统的存货收发存明细进行检查分析;
4、获取存货期末库龄表,结合存货的状况,对库龄较长的存货进行分析性复核,分析被审计单位计提的存货跌价准备是否合理,结合公司销售相关政策文件重新计算存货的跌价准备,测试其计算的准确性;
5、获取存货跌价准备计算表,抽取部分型号产品比较其在该表中记载的状态和库龄与通过监盘获知的情况是否相符;
6、通过比较同状态产品历史售价,以及根据季节性和周期性特征对产品未来售价变动趋势的复核,对管理层估计的预计售价进行评估,并与资产负债表日后的实际售价进行核对;
7、通过比较同类产品的历史销售费用和相关税费,对管理层估计的销售费用和相关税费进行评估,并与资产负债表日后的实际发生额进行核对;
8、复核评估机构评估的存货期末可变现净值中使用的主要参数、评估结果的合理性。
我们认为,针对公司存货跌价准备,我们已实施了必要的审计程序,公司存货跌价准备计提比例处于合理水平。
几大常用中文搜索引擎的对比 随着互联网的不断发展扩大,网络上中文信息资源和上网的中文用户也大量增加,各类中文搜索引擎更是层出不穷。以下我选取了Google中文,百度,搜狗,必应这几个常用的中文搜索引擎进行较为粗浅的比较。 先比较一下各搜索引擎的特点。Google中文:包括网页、图片、新闻搜索,支持个性化搜索及本地搜索,提供论坛、邮箱、日历服务和桌面搜索工具,是万维网上最大的搜索引擎,但Google中文在中国却一直受到百度搜索的压制,最终由于黑客攻击和敏感词过滤问题退出中国内地转至香港。百度:是全球最大的中文搜索引擎,除网页搜索外,还提供MP3、文档、地图、传情、影视等多样化的搜索服务,率先创造了以贴吧、知道为代表的搜索社区,是目前国内最大的商业化全文搜索引擎。搜狗:搜狗是全球首个百亿规模中文搜索引擎,收录100亿网页,创造了全球中文网页收录量新高,搜狗以网页搜索为核心,在音乐、新闻、图片、地图等方面提供了垂直搜索服务,通过说吧建立用户间的搜索社区,2010年8月搜狐与阿里巴巴宣布将分拆搜狗成立独立公司,引入战略投资,注资后的搜狗有望成为仅次于百度的中文搜索工具。必应(bing):必应是微软公司09年新推出的中文搜索引擎。主打快乐搜索体验。
接着从各方面对比:1.外观排版:Google、百度、搜狗的外观都是以简单的白色背景为主,而必应的背景是一副定期更换的图片,乍看比较新鲜,可是用习惯后我发现搜索引擎还是简洁一点好。不同于其他3家“相关搜索”出现在搜索结果的底部,必应在网页左侧和底部都出现了“相关搜索”,虽然略显重复,但在一定程度上为用户提供了方便。2.搜索结果:在这4家引擎同时输入“集美大学诚毅学院”,可以看到Google用时0.10 秒获得约62,900 条结果,百度用时0.018秒找到相关网页约55,000篇,必应没有显示用时找到共50,900 条,搜狗用时0.027 秒只有30,636条。可见在Google的搜索量大,而百度的时间最短,速度和数量比最好,搜狗略逊一筹3.搜索内容:四家网站的内容更新都比较及时,百度的优势在于很中国化很生活化,符合中国人的习惯。但它的内容的匹配度不如Google高,而且很商业化,广告和垃圾网站很多,适合搜索一般问题。Google专业搜索比较好,适合技术人员,学生教师,搜索范围较广。特别是Google的地图和翻译是其他搜索引擎无法比拟的。但是Google由于版权问题无法搜索MP3,这是个硬伤,因为搜索MP3在中国已经成为流行。Google的死链率也比较高,中文网站检索的更新频率不够快,“网页快照”功能在国内经常出现不可访问的问题。搜狗较多的被用在搜索新闻,音乐,电影上,娱乐性强,商机搜索和说吧也很有特色。必应搜索与传统搜索引擎只是单独列出一个搜索列表不同,微软还会对返回的结果加以分类。但必应默认搜索结果只显示5页,其他搜索引擎都是10页,在点击到第五页的时候,会自动出现9页结果,这显然
对分查找算法及程序实现 一、设计思想 对分查找是计算机科学中的一个基础算法。对于一个基础算法的学习,同样可以让学生在一定的情境下,经历分析问题、确定算法、编程求解等用计算机解决问题的基本过程。本堂课以一个游戏暖场,同时激活学生的思维,引导学生去探索游戏或生活背后的科学原理。为了让学生在教师的引导下能自我解析算法的形成过程,本课分解了问题动作,找出问题的全部可能情况,在对全部可能情况总结归纳的情况下,得出对分查找的基础算法,最后在程序中得到实现,从而使学生建立起对分查找算法形成的科学逻辑结构。 二、教材分析 本课的课程标准内容: (一)计算机解决问题的基本过程(1)结合实例,经历分析问题、确定算法、编程求解等用计算机解决问题的基本过程,认识算法和程序设计在其中的地位和作用。 (三)算法与问题解决例举 C 查找、排序与问题解决 (2)通过实例,掌握使用数据查找算法设计程序解决问题的方法。 本课的《学科教学指导意见》内容: 基本要求:1.初步掌握对分查找算法。 2.初步掌握对分查找算法的程序实现。 教材内容:第二章算法实例 2.4.3对分查找和第五章5.4查找算法的程序实现,课题定为对分查找算法及程序实现,安排两个课时,第一课时着重是对分查找算
法的形成和初步程序实现,第二课时利用对分查找算法解决一些实际问题的程序实现,本教学设计为第一课时。 从《课程标准》和《学科教学指导意见》对本课教学内容的要求来看,要求学生能从问题出发,通过相应的科学步骤形成对分查找的算法。对学生来说,要求通过这一课时的学习能初步掌握或了解对分查找的前提条件、解决问题的对象,明确对分查找算法结构和对分查找的意义。 三、学情分析 学生应该已经掌握程序设计的基本思想,掌握赋值语句、选择语句、循环语句的基本用法和VB基本操作,这节课学生可能会遇到的最大问题是:如何归纳总结对分查找解决不同情况问题的一般规律,鉴于此,在教学中要积极引导学生采取分解动作、比较迁移等学习策略。 四、教学目标 知识与技能:理解对分查找的概念和特点,通过分步解析获取对分查找的解题结构,初步掌握对分查找算法的程序实现。 过程与方法:通过分析多种不同的可能情况,逐步归纳对分查找的基本思想和方法,确定解题步骤。 情感态度与价值观:通过实践体验科学解题的重要性,增强效率意识和全局观念,感受对分查找算法的魅力,养成始终坚持、不断积累才能获得成功的意志品质。 五、重点难点 教学重点和难点:分解并理解对分查找的过程。 六、教学策略与手段 1、教学线索:游戏引领---提出对分查找原理--- 解析对分查找的算法特征---实践解决问题。
我国的轻资产运作成功案例 搜于特:低调上市的“乡村”时尚霸主 一提到东莞服装,大多数人的第一反应就是虎门。这个与广州南沙区隔着珠江口遥遥相望的东莞第一大镇,凭借区位优势,从一开始承接香港的服装加工订单,到形成专业的服装集散地,再到诞生出诸如以纯、佐霓、松鹰等服装品牌,服装几乎成了虎门的另一个代名词。 但多少令人有些惊讶的是,东莞的第一家服装上市企业却并没有诞生在虎门。2010年11月,一家来自东莞道滘的服装企业搜于特(002503),极其低调地在深圳中小板上市。用虎门服装服饰行业协会秘书长王敏健的话来说,搜于特的上市路径走得颇为“巧妙”。 创业ID 公司名:东莞市搜于特服装有限公司 创始人:马少文、马少贤兄妹(公司目前的实际控制者马鸿于2006年加入) 创立时间:2005年12月
创立地点:东莞市道滘镇 年营业额:近4亿元人民币(约80%的收入来自三四线市场) 店铺数量:近1000家(90%以上为加盟店铺) 融资及上市情况:融资记录暂未公开;2010年11月17日,登陆深交所中小企业板,股票代码:002503 “脱产”的服装企业 1987年,20岁的马鸿(原名马少鸿)凭着一股子闯劲,在珠三角地区服装集散地普宁县和广州白马服装批发市场之间做起了布料和服装批发零售的生意。或许连他自己也没有想到,这门生意一做就是15年。其间,他也曾跟朋友合伙办过制衣厂,但几经周折,最终都没有离开批发零售这一行。 2005年,马鸿的兄妹马少文和马少贤在东莞道滘成立东莞市搜于特服饰有限公司,开始在女装连锁零售领域进行摸索,而这对于跑了十几年服装批发市场的马鸿来说,无疑是最熟悉的一块市场。2006年,他加入搜于特,并开始主导公司的整体市场策略。
韩山师范学院 实验题目: 用邻接表实现广度优先搜索遍历连通图的算法实现 班级:2015级软工班作者:黄俊聪 #include
typedefint Status; typedef char VerTexType; typedefintOtherInfo; bool visited[MVNum]; typedefstructArcNode//边结点 { intadjvex;//该边所指向的顶点的位置 structArcNode* nextarc;//指向下一条边的指针 OtherInfo info;//和边相关的信息 }ArcNode; typedefstructVNode//顶点信息 { VerTexType data; ArcNode* firstarc;//指向第一条依附该顶点的边的指针}VNode,AdjList[MVNum];//Adjlist表示邻接表类型 typedefstruct { AdjList vertices; intvexnum,arcnum;//图的当前顶点数 }ALGraph; typedefstructQNode { char data; structQNode* next; }QNode,*QueuePtr; typedefstruct { QueuePtr front; QueuePtr rear; }LinkQueue; Status InitQueue(LinkQueue& Q) { Q.front=Q.rear=new QNode; Q.front->next=NULL; return OK; } Status EnQueue(LinkQueue&Q,int e)
山东省科学院情报所检索中心 科技查新委托书(红色标记为委托人必须填写) 项目名称: 项目主要负责人(1-3名) 委托人:委托单位: 联系人:联系电话: E-mail: 是否需邮寄(联系地址:邮编:)委托日期:预定完成日期: 山东省科学院情报所检索中心
说明: (1)查新项目名称、关键词,除国内查新外,国内外查新需要详细提供中、英文关键词,关键词的来源应是课题相关的专业惯用词,不能单纯地从一般词典中选择。查新人员根据用户提供的主题词进行复核后确定。 (2)委托人信息中包括机构名称,通讯地址,项目负责人姓名,联系人姓名,电话,传真及E-mail。 (3)认真填写待查新项目的科学技术要点一栏,该栏内容反映查新课题的需要确立的新颖点,要着重说明查新项目在科学技术特征、技术参数或指标、应用范围等方面,查新委托人自我判断的新颖性,空间不够时可加附页。如若报告科技要点或查新点不清楚,最好能给我们提供研究项目的技术报告。(1、科技内容:完整简要叙述查新项目的研究内容(类似文摘),要着重说明查新项目的主要科学技术特征、技术参数或指标、应用范围、查新委托人自我判断的新颖性等2.研制总结或预研报告:用作鉴定材料。3.技术背景:支持查新点。) (4)查新点主要是指需要查证的内容要点。(本查新项目与已有技术的明显不同之处,即需要查证的内容要点。要求填写清楚,查新中途不得更改),包括课题的研究内容、特点、结构、工艺、配方以及技术参数、指标和发明点等。 (5)委托书填好后,可以网上委托(发电子邮件,电子邮件的标题及委托书名称请按照,王萍--山东大学—申报科技攻关项目查新方式发送),请务必填好联系电话,发送邮件后请及时打电话予以确认;也可以直接将报告送过来。 (6)、正常时间,课题国内查新需4-5个工作日完成,国内外查新5-6个工作日完成。(特殊情况除外) (7)我们的地址: 山东省科学院情报研究所(济南市科院路19号)科学院机关楼东三楼(从东门进3楼) (9)、附: 委托书科学技术要点、查新要求书写示范
原文连接: https://www.wendangku.net/doc/ac8986506.html,/training/search/setup.html 从Android3.0开始,使用SearchView部件作为工具栏中的搜索部件,是您的应用程序的首选方式。和工具栏中的所有项目一样,只要有有空间,你可以定义SearchView显示在任何时候,或作为一个可折叠的活动,显示为一个图标,当用户点击它时,最初的Search View将占据整个工具栏用来搜索字段。 注:在这个类中,您将学习如何使您的不支持SearchView应用程序向下兼容的设备到An droid 2.1(API 7级)。 向工具栏添加搜索视图 要向工具栏添加一个的SearchView部件,可以在您的项目种创建一个名为res/menu/op tions_menu.xml文件,并添加下面的代码到该文件。此代码定义了如何创建搜索项目,比如该项目要使用的图标和标题。collapseActionView的属性可以让你的SearchView扩展到了整个工具栏,在不使用时又可以折叠回一个正常的工具栏项目。由于手持设备的工具栏空间有限,建议您使用collapsibleActionView属性来获得更好的用户体验。 注:如果你已经有一个XML文件菜单项,你可以向该文件中添加
注:如果您的可搜索活动以单顶模式(android:launchMode="singleTop")启动的话,也可以在onNewIntent()方法中处理ACTION_SEARCH意图。在单顶模式下,您的活动只有一个实例被创建,随后被调用来启动你的活动而不在栈上创建一个新的活动。这种启动模式是非常有用的,用户可以从相同的活动执行搜索,而无需每次都创建一个新的活动。
基于搜索引擎的中文关键字纠错系统 引言 在当今社会,信息的重要性日益凸显,如何有效的收集和传播成为了一项重要的技术。作为信息收集的有效手段之一,搜索引擎越来越多的得到人们的关注,例如Google,百度等大型搜索引擎迅速成为IT产业中最炙手可热的公司。搜索引擎面向社会各个阶层的大众用户,为了具有更好的交互性和可操作性,有必要为用户输入关键字提供纠错。一个搜索引擎的关键字纠错能力,可以人性化的指导用户尽可能的搜索到需的信息,这在一定程度影响着搜索引擎服务质量的好坏。 基于搜索引擎的中文关键字纠错系统(以下简称作“纠错系统”)尝试纠正用户输入的中文关键字中可能存在的错误,并把可能的正确输入推荐给用户。该系统能够发现用户输入中出现的选字错误,注音错误,字形错误以及其他的一些错误,并向用户推荐用户可能希望输入的正确关键字。该系统能够有效的为用户输入关键字提供指导,并能纠正一些现有的搜索引擎不能纠正但是在使用中经常出现关键字错误。 1. 应用背景: 进入信息时代,人类社会信息化进程加快,信息的重要性日益凸显,信息不仅成为与物质、能源同等重要的战略资源,而且获取信息也成了竞争角逐的重要手段。在这样的背景下,Google[2],百度[3](图1)等大型搜索引擎为广大用户提供了一个搜索和交流信息的平台,并且迅速的崛起。根据05年8月的统计数据,Google的月访问量为8040万人,位居全美网站第四位,而排名第一的是另一著名搜索引擎Yahoo(但Yahoo同时也提供其它服务)。而在中国,百度以37%的市场份额成为全球最大的中文搜索引擎[1]。 图1:Google和百度
作一个好的搜索引擎,不但需要有迅捷的搜索速度和全面的搜索内容,人性化的操作和指导也是搜索引擎服务质量好坏的重要标准。因此,大多搜索引擎都提供了高级搜索的功能以及一些人性化的附加功能,自动纠错就是其中的一种(图2,图3)。 图2:百度的自动纠错功能 图3:Google的自动纠错功能 由于中文是一种表意文字,它在词的切分以及词义方面的复杂性使得很多中文系统的处理比其他拼音文字要复杂的多。对于中文关键字的纠错也不例外,不考虑语义层次的信息(在语义层次上英文的规范化程度比中文要高很多,因此中文处理也要远远难于英文),英文纠错往往上只有简单的拼写错误,且不存在复杂的分词问题;而一个中文纠错系统需要面临的第一个问题就是中文分词问题。在中文中,单字往往都会有它自身的意义,而任意几个中文汉字组合在一起可能都会有某种含义,而交集型歧义和组合型歧义更是会经常出现。例如中文中“米兰球星”,在系统不考虑语义的情况下既可以正确的分词为“米兰/球星”,又可以分词为“米/兰球/星”(“兰球”是“篮球”的一种常见的不规范的使用方法,事实上,汉字使用的不规范也是中文纠错处理所面临的一大障碍)。而在假设输入关键字有错误的前提下,分词的难度就更大了。 即便解决了分词问题,中文输入所可能出现的错误也是五花八门多种多样,例如拼音输入时的选字错误(将“篮球”误为“蓝球”),由发音的不规范而导致的注音错误(将“邹韬奋”误为“周韬奋”),由于形近字造成的字形错误(将“彬彬有礼”误为“杉杉有礼”)等。因此,处理基于搜索引擎的中文关键字纠错,是一项很复杂的工作,虽然现有的很多搜索引擎(百度,Google等)都提供中文关键字纠错的功能,但是大部分还都停留在纠正简单错误的基础上,因此,为了能够提供更加人性化的服务,搜索引擎的中文关键字纠错功能还是有很大的改进
1:零次信息:如未经正式发表或不宜公开和大范围内交流的比较原始的素材、底稿、手稿、书信、工作文稿、工程图纸、考察记录、实验记录、调查稿、原始统计数字,以及各种口头交流的知识、经验或意见论点等。 一次信息:如专著、期刊和报纸、科学考察报告、研究报告、会议论文、学位论文、专利说明书、技术标准、政府出版物、产品样本等。 二次信息:如书目、题录、索引和文摘等。 三次信息:如专题述评、动态综述、系统评价、进展报告、学科年度总结、年鉴、指南和百科全书等。2:图书、期刊论文、科技报告、专利文献、会议文献、政府出版物、学位论文、标准文献、产品样本、科技档案。 3:人工语言优于自然语言检索: 因为自然愿不能简单明了而又专指地表达文献及检索课题的主题概念;不能够语词与概念一一对应,不能够排除多词一义、一词多义和词义含糊现象;不能显示出概念之间的关系;不能将概念进行系统排列;不能够在检索时便于将标引用语和检索用语进行相符性比较。 而人工语言涵盖了一系列概括文献情报内容的概念及其相互关系的概念,弥补了自然语言的不足,专门用于各种手工的和计算机化的情报检索系统,表达了文献主题概念和检索课题概念 4:主题词又称叙词,在标引和检索中用以表达文献主题的规范化的词或词组。主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。 常用的医学主题词表:《美国医学主题词表》(mesh) 《荷兰医学文摘的主题词表》(EMTree) 《中国中医药学主题词表》 5:题录数据库是用各种索引方法制作的二次文献数据库,又称题录数据库或篇名数据库,以简略的形式向用户提供文献的信息。 全文数据库不仅记录数目信息,如题名、著者、关键词、文摘等,同时还存储了一定数量的文献全文或其中主要部分,它是比二次文献数据库有更多、更好的检索方法,其传递的信息是完整的,是一种源数据库。 6:布尔逻辑检索,位置逻辑检索,截词检索,字段检索,范围运算,精确检索,加权检索。 7:逻辑“与”:逻辑“与”一般用AND或“*”号表示 逻辑“或”:逻辑“或”一般用OR或“+”号表示。 逻辑“非”:逻辑“非”一般用NOT或“-”号表示。 优先级:非>与>或 8:如在检索框内输入:Child*,它可代表child, children, childly, childhood 9:模糊检索:用一个关键字进行查询,查询结果均包含这个关键字。例如用“张明”作为关键字,那么包含有“张明”的记录均被查询出来,例如:张明明,张明生,张明远等。 精确检索又称短语检索,是将一个短语(词组)当做一个独立的运算单元,往往用双引号括起来,进行严格匹配,以提高查准率。查询结果是仅包含该短语(词组)的条目。 各数据库基本特点: Sinomed: 数据库类型:题录型数据库(二次文献数据库) 收录学科范围:生物医学学科 收录文献类型:期刊、汇编、会议论文、博硕士论文 检索方式(以CBM库为例):基本检索、主题检索(特色)、分类检索、期刊检索、作者检索 访问方式:收费型数据库,分为主站点(中心站点)、镜像站点,校内用户直接访问 分类检索是基于:《中国图书馆分类法.医学专业分类表》
.html .asp/.aspx .php .jsp Html语言变量、函数、组建、流程、循环、结构 代码结构进行优化 URL 统一资源定位符号universal resources locator 网络地址 Filetype Intitle Inurl 美萍点播系统VOD down:43 Site: 在站内进行检索 Intext: Seo搜索引擎优化-》sem搜索引擎营销-》网络营销 【项目背景介绍】 信息社会,信息以爆炸式的方式增长,网络环境下,搜索引擎是我们通往目的地的必备武器,但是在浩如烟海的网络信息里面,很多网友都只会简单的搜索,往往不能够很好的达到搜索的目的,因此也无法完成对海量信息的综合处理。作为电子商务专业学生,如何高效的完成信息检索,无论是对个人依托网络进行的学习还是今后的网络商务工作,都十分重要。 【项目工具简介和环境要求】 互联网机房 能正常访问互联网、IE插件正常 【项目延伸思考题】 搜索引擎的商用价值 各类搜索引擎通用的高级搜索命令 提高网站被检索可能性的建议 【项目教学难点】 网站备案机制 网站支付流程的合理性 网站联系信息的真实性判断 【项目实施步骤】 项目简介—快速测试—软件包传送—学生自我摸索(安装、调试、搜索等)—手把手—应用场合分析—新模式联想 随着网络技术尤其是WWW站点的快速发展和普及,人们通过Internet获取全球信息的可能性越来越大。可以说,我们所需要的信息,绝大部分都可以通过因特网获取。但是网络信息内容庞杂、分散无序,各种有价值、所需的信息资源淹没在信息的“汪洋大海”中,给人们查询和利用网络信息资源带来了极大的不便。为了更有效地开发和利用网络信息资源,人们研制了许多网络信息检索工具,其中WWW是Internet上增长最快、使用最方便灵活的多媒体信息传输与检索系统,越来越多的用户将自己的信息以WWW的方式在网上发布。WWW服务器已称为互联网上数量最大和增长最快的信息系统,因而可以检索WWW网址网页以及新闻论坛、BBS文章的检索工具——搜索引擎称为查询网络信息的最主要的检索工具。 有人说,会搜索才叫会上网,搜索引擎在我们日常生活中的地位已是举足轻重。你也许是个刚买了“猫”兴冲冲地要上网冲浪,也许已经在互联网上蛰伏了好几年,无论怎样,要想在浩如烟海的互联网信息中找到自己所需的信息,都需要一点点技巧。对于企业而言,学习搜索,提高技巧,就能找到更多的潜在客户。
来源Windows8论坛:https://www.wendangku.net/doc/ac8986506.html, 中文搜索引擎与国外搜索引擎的区别 因特网上的科学信息和电子杂志的总量在持续增长,整个网络可看作是一个可以检索的150亿单词的大电子百科全书。但是这些信息是极其无序的,如何获取和利用因特网上的信息已经成了一个大问题。目前解决这一问题的最佳途径是利用搜索引擎。 因特网上的信息呈几何级数增长,快速有效地查询一项艰巨的任务,这个需求直接导致了广域网信息检索技术的快速发展,各类搜索引擎层出不穷。 所谓搜索引擎,是指因特网上的在万维网(WWW)中主动搜索信息并能起自动索引、提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人)或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建成数据库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。科学家很早就梦想能够快速检索所有的科技文献,现在,搜索引擎使得在数秒钟内取得大量的文献成为可能。 中文搜索引擎概述 中文搜索引擎的出现是最近几年的事情,但发展很快。它的性能究竟如何,能检索到的信息有多少,因特网上的中文信息或网页知多少,这些都是值得关心的问题。 目前中文引擎共有约80多个,可以分为两类,一类是自由词或关键词检索搜索引擎,另一类是分类搜索引擎。由于语言、文化上的差异,中文搜索引擎必然与国外的搜索引擎有所不同。中文搜索引擎有两个特点。1.内码:由于历史原因,目前世界上使用中文的国家与地区在中文语言的使用上有较大差别,体现在计算机处理上也有很大不同,其中最重要的区别是采用不同的字符集及内码体系,例如祖国大陆用的是GB码,而中国台湾地区则用BIG5码,字符集的大小也不尽相同。
加步探索法 #include 对分法 #include 中文智能搜索引擎 龙其 072349 摘要 飞速发展的Internet给用户提供了海量的信息资源,导致用户从爆炸性增长的信息中迅速获得需要的信息变得越来越困难。为了帮助用户快速准确地检索到所需的网络信息,网络搜索引擎的研究与开发已经成为当今网络信息检索的热点。本文通过搜索引擎概述及原理介绍中文智能搜索引擎,从中文分词技术;词性标注及词义分析;分类器设计检索模型;PageRank排序技术;研究现状和发展趋势等内容对中文智能搜索引擎进行介绍。 搜索引擎概述及原理 搜索引擎是以Web页面为检索文档的信息检索系统,它的核心就是信息检索技术。广义地说,搜索引擎就是指在指互联网上能够响应用户提交的搜索请求,返回相应的查询结果信息的技术和系统。 搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。 搜索引擎并不是真正地搜索互联网,它搜索的是预先整理好的网页索引数据库。一般来说,搜索引擎得原理可以看做三步:从互联网中抓取网页;建立索引数据库;在索引数据库中进行搜索排序。 (1)互联网中抓取网页:通过网页搜索工具Spider(蜘蛛)或Robot(机器人)等自动访问互联网,沿着URL搜索,并把搜索到的信息带回搜索引擎。 (2)建立索引数据库:通过对收集的网页信息进行分析,把这些相关信息进行分类索引建立索引数据库。 (3)在索引数据库中进行搜索排序:通过Web服务端软件,获得用户输入关键词后,有搜索程序从网页数据库中找到符合该关键词的相关网页。为用户提供浏览界 面下的查询信息。 搜索引擎结构图 中文智能搜索引擎 1.中文搜索引擎 中文搜索引擎是指以Interent网络上的中文信息为主要对象,提供信息的自动收集、自动过滤、自动索引中和检索导航等服务的搜索引擎。中文Internet搜索引擎的最关键组件是能够在海量中英文数据上进行高效全文检索的信息管理系统。中文搜索引擎的机制同英文搜索引擎大致相同,不同的是多了中文语言的处理技术,这主要是中文分词技术和汉化技术。 逻辑上,中文信息搜索引擎与与一般搜索引擎一样分为三个部分:网页搜索引擎,索引引擎和查询引擎。 2.智能搜索引擎 传统搜索引擎局限:传统搜索引擎主要采用网站分类技术和全文检索技术来实现信息查询,前者成本高,对网站描述也比较简单,不能升入网站内部细节。而后者效率比较低且返回信息过多。 传统搜索引擎所使用的技术都难以解决用户“找信息难”的问题,造成这种困难的实质在于搜索引擎缺乏知识处理能力和理解能力。因此要把信息检索从基于关键词层面提高到基于知识层面。 智能搜索引擎,它突破传统搜索引擎基于要求较精确的关键词层面信息检索的局限,发展到基于以不规范、不精确的自然形式出现的知识(或概念)层面来分析和处理用户的查询提问,具有良好的自然语言理解、知识处理能力,在信息检索过程中体现出很强的智能化与人性化优势。 3.中文智能搜索引擎 采用智能搜索引擎得方法实现对中文信息的检索。中文智能搜索引擎可以自动分析中文网页,进行自动分词处理,并自动提取关键词,建立一关键词为基础的查询数据库,降低了系统开销,大大提高了查询效率。它通过充分考虑中文语句的表达结构以及“口语化的提问,智能化的结果”来满足用户的各种查询需求。 中文智能搜索引擎功能结构图大致如下: 一、界面、广告以及速度搜索引擎在我们日常操作中的使用频率非常高,大家使用它的目的都非常明确,就是用它来搜寻需要的内容,而不会为搜索引擎的页面做过多的停留,因此搜索引擎的界面设计和速度就对我们的使用产生不小的影响,下面来看看这六款搜索引擎在界面和速度上的表现。谷歌、百度和微软的Live Search,这三大搜索引擎的界面大家都已经相当熟悉,它们有着共同的特点,就是简洁至极:网站LOGO、搜索框和按钮以及个别功能服务链接,除此以外,页面上就没有其他多余和花哨的东西了,给人的感觉非常清爽,界面一目了然,特别是Live Search在不失简洁的同时还通过一些小脚本和背景图片使得页面整体更加美观。三者使用起来都很方便,并且首页界面上没有任何第三方的广告。搜索结果页面,三者同样是采用简洁的风格,页面左侧排列着搜索结果,百度搜索结果页面右侧有不少广告,谷歌视关键词的不同也可能出现右侧广告。 Live Search的界面十分简洁且美观 百度搜索结果页面右侧的广告与上面三者相比,雅虎全能搜在界面上显得更为活泼、色彩更加多样,并且在首页内容上也更丰富。首页上除了常规的搜索所需组成部分外,雅虎全能搜还加入了天气预报、邮箱登录的显示区域。虽然这些占据了一点点页面,但是它们功能实用且不影响正常使用。雅虎全能搜的搜索主页 搜狗搜索的界面可谓结合了谷歌和Live Search:在布局上 与谷歌类似,而在细节上与Live Search有着异曲同工之妙;而搜索新军——网易有道的界面与谷歌、百度站在同一阵线,风格、版式都十分一致。在搜索结果页面中,搜狗搜索页面左侧有少量广告。总的来说,六款搜索引擎的界面设计都比较合理、美观、大方。雅虎全能搜的界面稍有不同,加入了天气预报和邮箱模块,而其他五款都尽量精简,其中谷歌、百度和有道趋于一致,采用最简的风格,而Live Search和搜狗在首页的一些细节上多加以了一些修饰。此外,值得一提的是一些搜索引擎对于Logo文化的重视,在传统的节日或者一些特殊的纪念日时都会将首页的Logo徽标换成与该日子相关的设计。其中在这方面要数谷歌和百度做得最为出色:无论是三八节、五一节这样的国际节日,或者情人节、万圣节这样的西方舶来物,还是春节、清明、端午等传统的中国农历节日,谷歌和百度都会精心设计相应的节日Logo;此外,谷歌在一些特殊的纪念日,如达芬奇诞辰、地球日之类的纪念日也会推出专门的徽标;而百度近期开始定期在首页推出一个搜索封面人物,以此反映对互联网时代风云人物的价值取向,十分有特色。雅虎和搜狗在节日Logo设计方面也有所表现,在节日时也可经常看到其专门的徽标;网易有道正式版新近推出不久,我们还无法对其在特殊Logo的设计上是否会有所表现作出评价。搜索引擎的特色Logo其实并不仅仅是一个单纯的设计,它还有更多的作用:它承载了一种信息,传达了搜索引擎提供商对于创新、 搜索引擎/网络蜘蛛程序代码(转) 2008-07-12 09:54 国外开发的相关程序 1、Nutch 官方网站 https://www.wendangku.net/doc/ac8986506.html,/ 中文站点 https://www.wendangku.net/doc/ac8986506.html,/ 最新版本:Nutch 0.7.2 Released Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。 2、Lucene 官方网站 https://www.wendangku.net/doc/ac8986506.html, 中文站点 https://www.wendangku.net/doc/ac8986506.html,/ Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包[用Java写的],即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 3、Larbin: https://www.wendangku.net/doc/ac8986506.html,/index-eng.html larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret 独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 国内开发的相关程序 1、SQLET - 开放源码的中文搜索引擎 官方网站 https://www.wendangku.net/doc/ac8986506.html,/ SQLET,是Search & Query &Link, 加后缀 let,表示小的,小型的意思.打算建立一个能搜上亿张网页的基于主题功能的中文搜索引擎.支持3种索引方式:MySql_table_Index,Lucene_Index,SQLET_Index.网页抓取可以保存在文件系统及数据库里。自带WebServer. 2、菲度垂直搜索引擎代码 菲度https://www.wendangku.net/doc/ac8986506.html, 为一个垂直在线搜索的演示版,主要对国内一些购物站点进行搜索整理, 语言:https://www.wendangku.net/doc/ac8986506.html,(c#) 二、中文分词程序代码 1、计算所汉语词法分析系统 ICTCLAS 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果),基于角色标注的未登录词识别能取得高于90%召回率,其中中国人名的识别召回率接近98%,分词和词性标注处理速度为31.5KB/s。ICTCLAS 和计算所其他14项免费发布的成果被中外媒体广泛地报道,国内很多免费的中文分词模块都或多或少的参考过ICTCLAS的代码。 下载页面:https://www.wendangku.net/doc/ac8986506.html,/project/project.php?proj_id=6 由于 ICTCLAS 是由 C 语言写成的,现在主流的开发工具用起来不太方便,于是有一些热心的程序员把 ICTCLAS 改为 Java 和 C# 等其他语言。 (1)fenci,Java 的 ICTCLAS,下载页面: https://www.wendangku.net/doc/ac8986506.html,/printpage.asp?BoardID=2&id=11502 (2)AutoSplit,另一个 Java 的 ICTCLAS,已经找不到下载页面,点击本地下载 (3)小叮咚中文分词,曾经有下载页面,现在找不到了。据作者介绍,从 ICTCLAS 中改进,有 Java,C# 和 C++ 三个版本,介绍页面: https://www.wendangku.net/doc/ac8986506.html,/accesine 2、海量智能分词研究版 海量智能计算技术研究中心为了使中文信息处理领域的研究者们能够共同分享海量智能中心的研究成果,共同提高中文信息处理水平,特此发布《海量智能分 深度优先搜索遍历算法 深度优先搜索的过程 深度优先搜索所遵循的搜索策略是尽可能“深”地搜索图。在深度优先搜索中,对于最新发现的节点,如果它还有以此为起点而未搜索的边,就沿此边继续搜索下去。当节点v的所有边都己被探寻过,搜索将回溯到发现节点v有那条边的始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被发现为止。即 ⒈以给定的某个顶点V0为起始点,访问该顶点; ⒉选取一个与顶点V0相邻接且未被访问过的顶点V1,用V1作为新的起始点,重复上述过程; ⒊当到达一个其所有邻接的顶点都已被访问过的顶点Vi时,就退回到新近被访问过的顶点Vi- 1,继续访问Vi-1尚未访问的邻接点,重复上述搜索过程; ⒋直到从任意一个已访问过的顶点出发,再也找不到未被访问过的顶点为止,遍历便告完成。 这种搜索的次序体现了向纵深发展的趋势,所以称之为深度优先搜索。 深度优先搜索算法描述: 程序实现有两种方式--递归与非递归。 一、递归 递归过程为: Procedure DEF-GO(step) for i:=1 to max do if 子结点符合条件 then 产生新的子结点入栈; if 子结点是目标结点 then 输出 else DEF-GO(step+1); 栈顶结点出栈; endif; enddo; 主程序为: Program DFS; 初始状态入栈; DEF-GO(1); 二、非递归 Program DEF(step); step:=0; repeat step:=step+1;j:=0;p:=false repeat j:=j+1; if 结点符合条件 then 产生子结点入栈; if 子结点是目标结点 then 输出 else p:=true; else if j>=max then 回溯 p:=false; endif; until p=true; 排名公司名称 1 中国南方电网有限责任公司 2 中国平安保险(集团)股份有限公司 3 华润股份有限公司 4 华为技术有限公司 5 正威国际集团有限公司 6 招商银行股份有限公司 7 广州汽车工业集团有限公司 8 万科企业股份有限公司 9 美的集团股份有限公司 10 中国石油化工股份有限公司广东石油分公司 11 珠海格力电器股份有限公司 12 广东物资集团公司 13 广东振戎能源有限公司 14 中国南方航空股份有限公司 15 恒大地产集团有限公司 16 保利房地产(集团)股份有限公司 17 TCL集团股份有限公司 18 中海石油炼化有限责任公司惠州炼化分公司 19 中国长城计算机深圳股份有限公司 20 广发银行股份有限公司 21 中兴通讯股份有限公司 22 广州铁路(集团)公司 23 广东省广新控股集团有限公司 24 碧桂园控股有限公司 25 腾讯控股有限公司 26 中国国际海运集装箱(集团)股份有限公司 27 南方石化集团有限公司 28 广东省粤电集团有限公司 29 比亚迪股份有限公司 30 玖龙纸业(控股)有限公司 31 华侨城集团公司 32 广州医药集团有限公司 33 百丽国际控股有限公司 34 深圳市神州通投资集团有限公司 35 广州市建筑集团有限公司 36 广东省广晟资产经营有限公司 37 广东省丝绸纺织集团有限公司 38 广州富力地产股份有限公司 39 广州钢铁企业集团有限公司 40 雅居乐地产控股有限公司 41 中国广核集团有限公司 42 广东温氏食品集团股份有限公司 43 金地(集团)股份有限公司 44 腾邦投资控股有限公司 45 创维集团有限公司 46 招商局地产控股股份有限公司 47 广东电力发展股份有限公司 48 生命人寿保险股份有限公司 49 广东省广业资产经营有限公司 50 深圳市飞马国际供应链股份有限公司 51 广东省交通集团有限公司 52 天音通信有限公司 53 广州轻工工贸集团有限公司 54 广州金创利经贸有限公司 55 深圳中电投资股份有限公司 56 广东省建筑工程集团有限公司 57 海信科龙电器股份有限公司 58 广州金博物流贸易集团有限公司 59 广州万宝集团有限公司 60 国药集团一致药业股份有限公司 61 深圳市中金岭南有色金属股份有限公司 62 白云电气集团有限公司 63 宝钢集团广东韶关钢铁有限公司 64 广州农村商业银行股份有限公司 65 广州越秀集团有限公司 66 康佳集团股份有限公司 67 中国石油天然气股份有限公司华南化工销售分公司 68 深圳海王集团股份有限公司 69 广东海大集团股份有限公司 70 广州白云山医药集团股份有限公司 71 广州元亨能源有限公司 72 日立电梯(中国)有限公司 73 广州发展集团股份有限公司 74 中信证券股份有限公司 75 天虹商场股份有限公司 76 深圳市东风南方实业集团有限公司 77 中铝佛山国际贸易有限公司 78 广东粤合资产经营有限公司 79 广深铁路股份有限公司 80 深圳融禾投资发展有限公司 81 广东粤海控股有限公司 82 宜华企业(集团)有限公司 83 深圳长城开发科技股份有限公司 84 金发科技股份有限公司 85 广州纺织工贸企业集团有限公司 86 康美药业股份有限公司 87 广州晶东贸易有限公司 这里的“搜索”是指Windows XP“开始”菜单的“搜索”功能,也许您会说,这个东西我早就熟悉了,不需要您在这里浪费口舌。您真的熟悉了吗?我看未必,要知道,微软(Microsoft)为这个功能可谓“煞费苦心”。在“开始”菜单您所看到的这个“搜索”功能仅仅是微软全文搜索引擎的查询界面,实际上,在这个查询界面的背后隐藏着一个庞大的数据库系统,它就是微软的索引服务,所以,要讲清“开始”菜单的“搜索”功能,就得从微软的索引服务说起。 一、索引服务的来历和特点索引服务是微软全文搜索技术在Windows中的应用,它最早出现在Windows NT 4.0上,叫做Index Server,那时它只能爬行和创建(在全文搜索技术中,提取文档信息的过程叫做“爬行”)Internet Information Services(IIS)Web服务器上的内容,到了windows 2000,它已能爬行和创建文件系统以及虚拟Web站点的内容,而且也融入到了Windows内部,成了Windows系统的一项基本服务。索引服务是一种后台运行的服务,它从文档中提取并组织信息,以便能够通过Windows XP的“搜索”功能、索引服务查询表或Web浏览器快速容易地访问这些文档。提取的信息可以包含文档中的文本或文档的特征和参数(文档的属性),例如文档的作者姓名。一旦创建了索引,您就可以对包含关键字、词或属性的文档进行搜索。例如,可以搜索所有包含“产品”一词的文档,也可以查询作者是“杨兴平”的所有Microsoft Office文档。搜索完成后,索引服务将返回符合搜索条件的所有文档列表。提示:文档的特征和参数在Windows中称作文件的“属性”,它包括文档的文件名、标题、作者、创建时间等属性值,一般可以在应用程序或者在资源管理器中通过打开“属性”对话框查看和修改。例如,一篇Word文档,利用Word打开后可通过“文件→属性”打开它的“属性”对话框就可以查看和修改它的属性值(如图1)。 索引服务具有如下特点。⒈支持多种文件格式。索引服务依靠文档筛选器对多种格式的文件进行索引,在缺省情况下,它能索引网页文件、文本文件、Microsoft Office 程序创建的文件以及Internet邮件和新闻。提示:筛选器(Ifilter)也叫过滤器,它是一种从特定的文档格式中提取文字串和属性值的程序,比如Microsoft Office筛选器可以从Word、Excel和Powerpoint文件中提取文本信息和文档的属性值。在索引服务中,其它的筛选器还有Html筛选器和电子邮件筛选器等,另外,您也可以安装第三方的筛选器比如Adobe 提供的PDF文件筛选器来扩展索引服务能够索引的文件类型。⒉零维护设计。索引服务可以连续运行并且几乎不需要维护。安装索引服务后,所有的操作都将自动完成,包括索引的创建,索引的更新以及突然掉电时的故障恢复。 二、索引服务的安装和启动在安装Windows时,可以选择安装索引服务组件,也可以在安装后添加索引服务组件,步骤如下:第一步:打开控制面板,双击“添加或删除程序”。第二步:在“添加或删除程序”窗口中双击“添加/删除Windows组件”第三步:在“Windows组件向导”中选择“索引服务”,然后单击“下一步”按照提示进行安装。缺省情况下,安装后的索引服务以手动方式启动,也就是说Windows启动时,索引服务并未启动。如果在搜索界面需要索引服务的支持,那么Windows将会弹出启动索引服务的提示,这时若选择了启动搜索服务,那么索引服务将会变成自动启动的服务。手工启动索引服务的步骤如下。第一步:在桌面上右击“我的电脑”,在弹出的菜单上中文智能搜索引擎
六大搜索引擎的比较
搜索引擎网络蜘蛛程序代码
深搜广搜遍历算法
中国一百强企业
轻松打造自己的快速桌面搜索