如何与知名网站做友情链接,wordpress生成推广链接地址,他达拉非能延时多久,可以免费下载ppt模板的网站一 背景
大致背景是这样的#xff0c;笔者在做数据处理时#xff0c;遇到一个棘手的事情#xff0c;主要遇到如下字符串拼接变动的场景#xff0c;场景主要为#xff0c;需要考虑如下两张表的组合#xff1a; 表1-原始文本样式
序号文本样式1A变量B2A变量C3A变量CD4E变…一 背景
大致背景是这样的笔者在做数据处理时遇到一个棘手的事情主要遇到如下字符串拼接变动的场景场景主要为需要考虑如下两张表的组合 表1-原始文本样式
序号文本样式1A变量B2A变量C3A变量CD4E变量CF5C变量CE6B变量CD
其中文本里的变量有一个取值范围这个范围只有用户提供的时刻才知道有多少范围大致的变量是这样 表2-变量取值范围
序号变量1a2b3c4d5e6f
如果做上述的变量组合文本存在的组合场景有很多简单举例A变量B的组合文本就有6种组合,组合参考如下
序号组合文本1AaB2AbB3AcB4AdB5AeB6AfB
二 数据处理
数据处理的思路可以参考如下几种 第一种手工复制粘贴 一开始我想在Excel做简单的复制粘贴草草了事但是实际的数据量要比例子里的还要多很多倍而且很可能手工处理粘贴处理错误所以考虑下还是做特殊的自动化处理比较妥当。 第二种使用powerBI 微软Excel工具它的PowerBI功能可以组合出上述场景但是由于笔者的电脑现在不是Windows此方法暂时没有使用如果有Windows电脑类似诉求的可以使用之前记录的powerBI文档笛卡尔积在Excel中的连接使用 第三种训练chatGPT 我尝试使用chatGPT来自动给我生成文本但是尝试多次的数据沟通和训练结果并不理想还浪费了我很多检查和优化的对话时间。
第四种使用代码辅助 最后我借用python代码做了如下的简单处理主要处理步骤如下 1.使用代码生成组合场景 2.导出数据到Excel 3.进行简单excel函数处理做文本拼接 步骤1python脚本参考样例 import itertools
import numpy as np
import pandas as pd# 定义两个数据集
raw_path ./test_date/
A [1,2,3,4,5,6]
B [ a,b,d]# 使用itertools库的product函数计算笛卡尔积
cartesian_product list(itertools.product(A, B))
getform pd.DataFrame(cartesian_product)
getform.to_csv(mytest.csv,indexFalse)# 打印结果
for item in cartesian_product:print(item)步骤2 导出Excel 导出Excel的数据截图长这个样子考虑怎么简单怎么来标黄的部分为表头没有定义标题默认为0和1 步骤3 简单Excel处理 主要使用的函数 VLOOKUP函数查询当前可能存在的原始文本模式 SUBSTITUTE函数将当前的可替换变量替换成要组合的实际字符 参考数据截图如下 C2单元格的处理函数VLOOKUP(A2,J:K,2,0) D2单元格的处理函数SUBSTITUTE(C2,“变量”,B2) 当然如果数据量比较大也可以考虑将步骤3的函数做代码处理一步生成对应的Excel报表由于数据量还算适中因此没有做这么复杂