利用python反查53KF的详细数据,SEM优化师好帮手
在数字营销分析的领域,客服系统扮演着至关重要的角色。53客服系统能够根据对话内容来检索特定的访客信息,但这个过程是手动且逐一进行的,并没有提供相应的API接口以便自动化处理。数据分析不仅需要关注转化率,无效数据的识别和分析同样重要。通常,客服人员能够提供的无效反馈仅限于电话号码,而在下载的数据中,往往缺少了电话这一关键信息,这就给数据匹配工作带来了挑战。
然而,解决方案总是存在的。53客服系统虽然不直接提供电话信息,但它允许将聊天记录以HTML格式下载。这些HTML文件包含了详细的聊天内容,我们可以从中提取出访客的IP地址,进而与Excel中的数据进行整合。此外,如果需要,也可以直接从HTML文件中提取所有必要的数据,为数据分析提供了另一种可能。
通过这种方法,即使没有电话号码这一关键信息,我们也能够通过IP地址将访客的聊天数据与其他相关数据关联起来,从而进行更全面的数据分析。这虽然不是最直接或最自动化的方法,但它确实为我们提供了一个可行的方案来解决数据整合的问题。
总结来说,尽管53客服系统在数据提供方面存在局限性,但通过利用其提供的HTML下载功能,我们可以绕过这些限制,提取必要的数据,以支持我们的数据分析需求。
利用python提取53客服关键信息
第一步:下载53的html数据后,提取所有的ip、时间放入数组;
第二步:然后整理出每个访客的对话内容,清除换行、空格等干扰信息;
第三步:逐行读取无效电话内容,如果对话内容包含,则是无效,输出对应ip 时间,到数组;
第四步:导出结果。
python实施代码
# -*- coding: utf-8 -*-
import pandas as pd
from bs4 import BeautifulSoup
path = input(‘输入文件名: ‘)
path = path + ‘.html’
with open(path, ‘r’,encoding=’UTF-8′) as f:
Soup = BeautifulSoup(f.read(), ‘lxml’)
table=Soup.find(‘table’).find_all(‘tr’)
i=0
j=0
ips=[]
tms=[]
dhs=[]
jg=[]
for ttr in table:
try:
tds=ttr.find_all(‘td’,class_=”td_0″)
ip=tds[11].get_text().replace(‘\n’,”).replace(‘\r’,”).replace(‘\r\n’,”)
time=tds[3].get_text().replace(‘\n’,”).replace(‘\r’,”).replace(‘\r\n’,”)
ips.append(ip)
tms.append(time)
此处内容需要权限查看
vlookup使用方法
VLOOKUP函数是Excel中的一个纵向查找函数,功能是按列查找,最终返回该列所需查询序列所对应的值;与之对应的HLOOKUP是按行查找的。详细使用方法:
=VLOOKUP(F925,I:K,3,0)
这里通过电话号码查询,返回无效资源的ip地址,现在客服反馈的无效资源就包含了电话,无效原因,和ip地址。
无效分析
1、初级分析,通过vlookup函数利用ip将无效原因输出到53excel版本的数据中,满足基本的时间段或者是地域的无效分析。
优点:操作简单
缺点:重复操作,分析内容有限
2、加入数据模型,系统分析关键词、搜索词、单元、计划、时间、地域的无效情况。
优点:分析全面,一次解决
缺点:初次操作难度较高
在power query中导入包含ip的无效资源数据ip_jmk,然后在转换数据中使用List.Contains函数,标记转化是否是无效。
= Table.AddColumn(重命名的列4, "是否无效", each if List.Contains(ip_jmk[ip],[ip]) then "是" else null)
List.Contains({1,2,3,4},3)
true
List.Contains指示列表 list 中是否包含值value,返回逻辑值。
其实也不难,不过是开始找这个函数找了好久,本人小白 翻遍Power Query M 函数才找到这个可以利用的function。
以上就是老杨SEM博客分享关于《利用python反查53KF的详细数据,SEM优化师好帮手》文章的分享,希望这些内容能帮助在使用53客服咨询软件希望能快速分析留言及对话数据的小伙伴有所帮助!