python eval函数——求解字符串表达式 算法实现思路

目录

说明

算法

一、单栈

思路

代码实现

二、双栈

单双栈异同点

思路

特殊情况

★模拟图解

代码实现


说明

应对不同情况下的字符串表达式求值,本篇提供双栈和单栈两种解法。当表达式较为简单不存在括号时,可使用单栈求解,其他情况使用双栈。

算法

一、单栈

当表达式不存在括号时,如"3+2*5-4/2"可使用单栈求解。

思路

我们遍历表达式,每遇到一个运算符就对运算符前面的数字进行相应操作。

定义了一个栈,将消除乘除号后的数字添进栈中,最后使用sum方法将栈内元素求和得出最终结果。

  • 当遇到"+"号时,将符号前面的数字(称为num)压入栈中
  • 当遇到"-"号时,将(-num)压入栈中
  • 当遇到"*"号时,将栈顶元素与"*"号后面的数字相乘得出的结果赋值给栈顶元素
  • 当遇到"/"号时,将栈顶元素与"/"号后面的数字相除得出的结果赋值给栈顶元素

可以看到“+-”号性质相似,“*/”号性质相似,因此处理过程无非就两种形式。

思考:如何获取运算符后面数字的值?获取该值后是否会对下一次运算结果造成影响?我们是否应该对表达式后面的值进行操作而不是前面的?

思考完上面的问题后,我先回答第三个问题,这里的数值在表达式前后只是相对而言,参考的位置不一样,数字所在前后就不一样。没有必要纠结数字到底是在运算符前面还是后面。我们获取num的值是以运算符出现作为判断依据的,也就是说数字后面出现运算符的时候说明这个数字获取完成了。(那么此时可以说数字在运算符前面)

解决前面两问题的其中一个做法是定义一个变量(pre_operator)记录上一次运算符的值,当遇到一个运算符不着急处理,等下一次再出现运算符后才对这一次数据进行处理。我们规定pre_operator 的初始值是加号(加号的操作是将值压入栈中),因为我们是要等下一次出现运算符后再对前一次数据处理,当遍历到表达式末尾时,如果最后面没有一个运算符我们就无法获取最后一个计算结果了,因此要在表达式后面任意加一个运算符。

代码实现

class Solution:
    def calculate(self, s: str):
        # 定义栈
        stack = []
        # 用于记录上一次运算符
        pre_operator = '+'
        # 用于记录运算符前面的值
        num = 0
        for c in (s+'+'):
            # 如果c是空白符直接跳过
            if c == " ":
                continue
            # 如果c是数字
            if c.isdigit():
                # 可使用ord相减也可使用int(c)
                num = num*10 + ord(c) - ord('0')
            # 如果c是运算符
            elif c in "+-*/":
                if pre_operator == '+':
                    stack.append(num)
                elif pre_operator == '-':
                    stack.append(-num)
                elif pre_operator == '*':
                    # 栈顶元素与运算符前的数字相乘
                    stack[-1] = stack[-1]*num
                elif pre_operator == '/':
                    # 要使表达式更加精确,可写成stack[-1] = format((stack[-1]/num),'.5f')
                    stack[-1] = int(stack[-1]/num)
                # 初始化
                num = 0
                # 记录此时的运算符
                pre_operator = c
        return sum(stack)

二、双栈

当表达式更为复杂时可使用双栈解法。双栈目前支持的输入的字符有0~9,+-*/,(),双栈可应对较为复杂的表达式,如"3+6/-2"两运算符连续出现以及多括号嵌套"(10/(4*2+2)-3)*(4-8)"等情况。而单栈适用于常规计算,处理快易上手,二者各有优点。

单双栈异同点

双栈计算与单栈计算过程有许多相似之处。

  • 都是遇到下一运算符才计算上一个运算符。
  • 获取数字思路一致,都是不断遍历字符串,遇到非数字字符停止,并把数字加入到栈中。
  • 都是对字符串操作
  • 鉴于第一点,单双栈处理字符串时都要在字符串末尾加上一个运算符,才能完成整个表达式计算

不同的是,双栈引入运算符优先级概念;另外,双栈面向的是复杂表达式,需要考虑更多计算细节。

思路

双栈分别是数字栈和符号栈。遍历字符串,若该字符为

  • 数字,用变量num将数字存储起来,继续遍历,每遍历一个数字num左移一位(即乘10)直到遇到数字以外的字符停止,最后将变量num存入到数字栈中。
  • 括号,如遇左括号,直接将左括号放入符号栈,如遇右括号,将左右括号内的运算符计算完毕。
  • 运算符,每遇到一次运算符,判断该运算符的优先级与上一个运算符(符号栈栈顶的运算符)优先级的关系,如果优先级较低或相等(该运算符优先级<=上一运算符优先级)则进行计算消除栈顶运算符,每次计算消耗一个运算符,0到2个数字,循环下去,直到栈空或者优先级高于栈顶运算符为止。等计算完毕后再将此时的运算符放入到符号栈中。

解惑

1.数字与运算符之间如何计算?

这里是定义了一个方法用于计算表达式。该方法的思路是:取出符号栈的栈顶运算符,取出数字栈栈顶的两个数字,根据栈顶运算符来对两个数字进行相应的计算。就像第三点情况所说,每次计算消耗一个运算符,0~2个数字。为什么0~2个?默认是两个数字的,特殊情况下数字栈的元素会少于两个,那么这样就要用0来代替。计算完后将结果放入数字栈中。

2.如何理解"等计算完毕后再将此时的运算符放入到符号栈中"?

运算符有两个功能:1.触发上一运算符计算。2.完成使命(完成自己所处的表达式运算)。

为什么要靠运算符触发上一运算符计算?除了运算符,右括号也可以。因为一般表达式是这样的:“数字1  表达式1  数字2  表达式2..”看到这里我想大家都能明白了。表达式2触发“数字1 表达式1  数字2”计算(理解为助攻),当然计算不计算还得看表达式12的优先级了。最后才把运算符2放入符号栈。

3.如何理解 “判断该运算符的优先级与上一个运算符(符号栈栈顶运算符)优先级的关系,如果优先级较低或相等(该运算符优先级<=上一运算符优先级)则进行计算消除栈顶运算符”?

以“5+9/3-3”为例,遍历到‘/’时,根据前面所说,可能会触发上一运算符所处表达式即“5+9”计算,但是因为'/'优先级大于'+',所以无法触发计算,然后把'/'放入栈中。直到遇到下一个运算符‘-’号,‘-’优先级小于‘/’,触发计算,计算完‘9/3’ 因为'-'与‘+’同级,所以还能继续计算,直到栈空或优先级大于栈顶运算符优先级为止。

4.如何理解“将左右括号内的运算符计算完毕”?

因为括号内运算符已经是按优先级由低到高排好序了,所以不用考虑运算符之间的优先级的问题直接从后往前运算,将括号里面的运算符全部计算完毕(用完)。为什么已经排好序了?因为运算符入栈前会进行会判断,如果运算符优先级低于或等于栈顶运算符优先级会直接计算,然后被消除掉,无法入栈,所以入栈后运算符优先级都是一低一高关系。为什么一低一高,可以一低多高吗?不行,出现相同优先级的运算也会进行计算然后被弹出。

特殊情况

  • 表达式出现的空白字符,使用replace函数将其去除。
  • 括号内以负号开头时如:1+(-5+2)时,要在负号前面加0,不然在对‘-’号进行计算时会让1-5。与预期不符应换成1+(0-5+2)。
  • 表达式出现连续负号时要将其转化为正号,负负得正。(--1) -> (+1)。
  • 乘除运算符后面跟着负号时如(6/-2+4),我们要对-2加对括号和前导0变成(6/(0-2)+4)
  • 当表达式出现“++1”的类型时,计算过程会出现数字栈为空需要0替代的情况

★模拟图解

我以"5+9/(2-4)*6"(结果为-22) 为例模拟一下计算过程。

注意:计算到9/-2的时候我写成了4.5,应该是-4.5,大家留意一下。

代码实现

class Solution:
    def calculate(self, s: str):
        # 第一处替换是去除空白字符
        # 第二处替换是要在括号以负号开头添加前导0,否则数字栈数字对不上。第三处替换是将"--1"这种格式变成“+1”这种格式
        # 第二第三处替换均为特殊情况
        s = s.replace(" ", "").replace("(-", "(0-").replace("--", "+") + "+"
        length = len(s)
        # 定义两个栈分别存放运算符和数字
        op_stack, num_stack = [], []
        print(s)
        i = 0
        # 定义运算符优先级
        op_priority = {'+': 0, '-': 0, '*': 1, '/': 1, '%': 1}
        while i < length:
            c = s[i]
            # 判断c是否是数字
            if c.isdigit():
                num = 0
                while s[i].isdigit():
                    num = num * 10 + int(s[i])
                    i += 1
                # 跳出while循环后i所指的字符已经是运算符,因为大循环每结束一次都要加1,所以这里要退一步,之后再在大循环结束一次后加1
                i -= 1
                num_stack.append(num)

            elif c == '(':
                op_stack.append(c)
            elif c == ')':
                # 不断将括号内没有计算完的表达式计算完,直到遇到左括号为止。
                # 注意:括号内表达式的运算符优先级已经是由低到高排序了(一低一高),可以直接调用calc方法计算而无需考虑运算符优先级问题
                # 因为遍历到“后”运算符时如果“前”运算符优先级大于“后”运算符会取出栈内元素进行计算,
                # 计算后“前”运算符会消失,然后“后”运算符会压入栈中。也就是说只有符合优先级由低到高排序才能继续存在括号内,否则会被提前消除
                while op_stack[-1] != '(':
                    self.calc(num_stack, op_stack)
                # 将左括号弹出
                op_stack.pop()
            # 运算符分支
            else:
                # 特殊情况:当表达式出现 6/-2+5这种类型时,我们要给-2加上对括号和前导0变成 6/(0-2)+5才能继续计算
                if s[i-1] in "*/" and c == "-":
                    num_stack.append(0)
                    op_stack.append("(")
                    # 遍历往后字符串,直至遇到运算符或右括号为止,再其前面插入一个右括号
                    # 注意: 数字后面不能是左括号
                    f = i + 1
                    while s[f] not in ")+-*/":
                        f += 1
                    s = s[:f] + ")" + s[f:]
                    length += 1
                # “(”不是运算符没有优先级,在栈顶时不能参与优先级比较。
                while op_stack and op_stack[-1] != '(':
                    prev_op = op_stack[-1]
                    # 唯有当栈顶运算符的优先级小于此时运算符的优先级才不会被计算,即“前”运算符优先级小于“后”运算符优先级不会被计算(消除)。如 前面为“+”后面为“/”
                    if op_priority[prev_op] >= op_priority[c]:
                        # 将两个栈传过去后,相同的地址可以直接将两栈修改,而无需返回处理后的新栈再接收栈
                        self.calc(num_stack, op_stack)
                    else:
                        break
                op_stack.append(c)
            i += 1
            print(num_stack, op_stack)
        print(s)
        return num_stack[0]

    def calc(self, num_stack: list, op_stack: list):
        # 每调用一次该函数,数字栈里面至少有一个元素,只有连续出现两次运算符,数字栈才有可能为空, 这种计算x,y都需要补0。而这样的表达式一般只有"++1"这类情况
        # 一般情况下都不为0,或x(比y先出现的数字)才有可能是0,如-5的计算应看作0-5
        op, y, x = op_stack.pop(), num_stack.pop() if num_stack else 0, num_stack.pop() if num_stack else 0
        ans = 0
        if op == '+':
            ans = x + y
        elif op == '-':
            ans = x - y
        elif op == '*':
            ans = x * y
        elif op == '/':
            ans = x / y
        elif op == '%':
            ans = x % y
        # 使用round函数保留5位小数
        num_stack.append(round(ans, 5))


if __name__ == '__main__':
    st = "5+9/(2+4*5/(9+1)-1)*2"
    print(Solution().calculate(st))

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>